模型支持列表¶
NLP¶
masked_language_modeling¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
wiki |
- |
- |
text_classification¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
Mnli |
Entity F1 |
- |
run_txtcls_bert_base_uncased.yaml |
token_classification¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
CLUENER |
Entity F1 |
- |
run_tokcls_bert_base_chinese.yaml |
question_answering¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
SQuAD v1.1 |
EM / F1 |
80.74 / 88.33 |
run_qa_bert_base_uncased.yaml |
translation¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
WMT16 |
- |
- |
text_generation¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
alpaca |
- |
- |
run_bloom_560m.yaml |
|
ADGEN |
BLEU-4 / Rouge-1 / Rouge-2 / Rouge-l |
8.42 / 31.75 / 7.98 / 25.28 |
||
ADGEN |
BLEU-4 / Rouge-1 / Rouge-2 / Rouge-l |
7.47 / 30.78 / 7.07 / 24.77 |
||
wikitext-2 |
- |
- |
||
alpaca |
- |
- |
run_llama_7b.yaml |
|
alpaca |
- |
- |
run_llama_7b.yaml |
|
悟道数据集 |
- |
- |
||
- |
- |
- |
||
- |
- |
- |
||
wikitext-2 |
- |
- |
||
- |
- |
- |
CV¶
masked_image_modeling¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
ImageNet-1k |
- |
- |
image_classification¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
ImageNet-1k |
Accuracy |
83.71% |
||
ImageNet-1k |
Accuracy |
83.44% |
Multi-Modal¶
zero_shot_image_classification (by contrastive_language_image_pretrain)¶
模型 |
数据集 |
评估指标 |
评估得分 |
配置 |
|---|---|---|---|---|
Cifar100 |
Accuracy |
57.24% |
run_clip_vit_b_32_pretrain_flickr8k.yaml |
|
- |
- |
- |
run_blip2_vit_g_qformer_pretrain.yaml |
模型能力支持度¶
核心关键模型能力一览表¶
关键模型 |
并行模式 |
数据并行 |
优化器并行 |
模型并行 |
流水并行 |
多副本并行 |
预训练 |
微调 |
评估 |
推理 |
|---|---|---|---|---|---|---|---|---|---|---|
Bloom |
data_parallel\semi_auto_parallel |
是 |
是 |
是 |
是 |
是 |
是 |
全参微调 |
不支持 |
推理 |
GLM |
data_parallel\semi_auto_parallel |
是 |
是 |
是 |
是 |
是 |
是 |
全参微调,Lora微调 |
Blue/Rouge评估 |
推理 |
GLM2 |
data_parallel\semi_auto_parallel |
是 |
是 |
是 |
是 |
是 |
是 |
全参微调,Lora微调 |
Blue/Rouge评估 |
推理 |
GPT |
data_parallel\semi_auto_parallel |
是 |
是 |
是 |
是 |
是 |
是 |
全参微调 |
PPL评估 |
推理 |
LLaMa |
data_parallel\semi_auto_parallel |
是 |
是 |
是 |
是 |
是 |
是 |
全参微调,Lora微调 |
PPL评估 |
推理 |
LLaMa2 |
data_parallel\semi_auto_parallel |
是 |
是 |
是 |
是 |
是 |
是 |
全参微调 |
PPL评估 |
推理 |
PanGu |
data_parallel\semi_auto_parallel |
是 |
是 |
是 |
是 |
是 |
是 |
全参微调 |
PPL评估 |
推理 |
Research模型支持情况一览表¶
模型 |
任务(task name) |
模型(model name) |
|---|---|---|
baichuan_7b |
||
baichuan2_7b |
||
InternLM-7B |
||
ziya-13B |
Text Generator支持度表¶
model |
模型文档链接 |
增量推理 |
流式推理 |
|---|---|---|---|
bloom |
√ |
√ |
|
GLM |
√ |
√ |
|
GLM2 |
√ |
√ |
|
GPT |
√ |
√ |
|
llama |
√ |
√ |
|
llama2 |
√ |
√ |
|
pangu-alpha |
√ |
√ |
|
T5 |
× |
√ |
|
research |
research |
research |
research |
baichuan |
√ |
√ |
|
baichuan2 |
√ |
√ |
|
internlm |
√ |
√ |
|
ziya |
√ |
√ |
边训练边评估支持度表¶
模型 |
评估指标 |
可用Model.eval完成评估 |
是否支持 |
数据并行模式 |
半自动并行模式 |
|---|---|---|---|---|---|
bert |
- |
- |
- |
- |
- |
blip2 |
- |
- |
- |
- |
- |
bloom |
- |
- |
- |
- |
- |
clip |
- |
- |
- |
- |
- |
filip |
- |
- |
- |
- |
- |
glm |
Rouge,Bleu |
否 |
否 |
× |
× |
gpt2 |
PPL |
是 |
是 |
√ |
√ |
llama |
PPL |
是 |
是 |
√ |
√(7b 至少8卡) |
llama2 |
PPL |
是 |
是 |
√ |
√(7b 至少8卡) |
MAE |
暂缺 |
- |
- |
- |
- |
pangu alpha |
PPL |
是 |
是 |
√ |
√ |
qa-bert |
f1, precision, recall |
是 |
是 |
√ |
× |
swin |
Accuracy |
是 |
是 |
√ |
× |
t5 |
暂缺 |
- |
- |
- |
- |
tokcls-bert |
f1, precision, recall |
是 |
是 |
√ |
× |
txtcls-bert |
Accuracy |
是 |
是 |
√ |
× |
vit |
Accuracy |
是 |
是 |
√ |
× |
research |
research |
research |
research |
research |
research |
baichuan |
PPL |
是 |
是 |
√ |
√(7b 至少8卡) |
baichuan2 |
PPL |
是 |
是 |
√ |
√(7b 至少8卡) |
internlm |
PPL |
是 |
是 |
√ |
√(7b 至少8卡) |
ziya |
PPL |
是 |
是 |
√ |
√(13b 至少16卡) |
微调支持列表¶
模型 |
微调算法 |
运行模式 |
|---|---|---|
Lora |
finetune、eval、predict |
|
Lora |
finetune、eval、predict |
|
Lora |
finetune、eval、predict |
|
Lora |
finetune、eval、predict |
Chat Web支持列表¶
模型 |
规格 |
分词器 |
增量推理 |
|---|---|---|---|
GLM |
glm_6b |
glm_6b |
支持 |
GLM2 |
glm2_6b |
glm2_6b |
支持 |
BLOOM |
bloom_7.1b |
bloom_7.1b |
支持 |
LLAMA |
llama_7b_lora |
llama_7b_lora |
支持 |
其余库上模型分布式支持情况一览表¶
模型 |
并行模式 |
数据并行 |
优化器并行 |
模型并行 |
流水并行 |
多副本并行 |
|---|---|---|---|---|---|---|
Bert |
data_parallel |
是 |
是 |
否 |
否 |
否 |
BLIP2 |
data_parallel |
是 |
是 |
否 |
否 |
否 |
CLIP |
data_parallel |
是 |
是 |
否 |
否 |
否 |
MAE |
data_parallel |
是 |
是 |
否 |
否 |
否 |
Swin |
data_parallel |
是 |
是 |
否 |
否 |
否 |
T5 |
data_parallel |
是 |
是 |
否 |
否 |
否 |
VIT |
data_parallel |
是 |
是 |
否 |
否 |
否 |