开源古文BERT模型比较

近来想尝试用BERT (Bidirectional Encoder Representations from Transformers) 分析一下古诗词^[1]。搜索到一些开源模型，在此略作总结比较（大致按年份排序）。看下来SikuBERT提供的信息较为详细，可以一试。

注：另有日本团队基于GuwenBERT开发的模型(HF)，但信息不全故不收录。

	SikuBERT SikuRoBERTa
链接	GH / HF
文章	link
尺寸	base
初始化	BERT-base-chinese RoBERTa-wwm-ext-Chinese
训练数据	500M字（四库全书，繁体）
词表大小	30K
团队背景	南京农业大学
发布时间	2021

参考数值：

BERT-medium L=8, A=8, H=512
BERT-base L=12, A=12, H=768
BERT-large L=24, A=16, H=1024

BERT-base-chinese词表大小21K