
BigBangTransformer[乾元]是基于GPTDecoder-only架构的大规模预训练模型。继2022年开源BBT-1-0.2B模型之后,我们正式开源最新系列的BBT模型:BBT-1-1B,BBT-2-12B-Text,BBT-2.5-13B-Text。预训练语料库覆盖14个高质量数据源,覆盖书籍、百科、论文、小说、新闻、政策文件、中文博客、社交媒体等多个数据源种类。BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文2000亿tokens进行预训练。
模型开源后所有开发者可以:
1.可以直接调用大模型进行对话
2.在我们训练的基础上使用自由语料库继续训练
3.对大模型进行微调训练以满足各种下游任务
数据统计
数据评估
关于乾元BigBangTransformer特别声明
本站玉米导航提供的乾元BigBangTransformer都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由玉米导航实际控制,在2024年7月8日 下午5:23收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,玉米导航不承担任何责任。
相关导航

由云从科技多年积累的人工智能、云计算、大数据、人机交互等核心技术构建而成

元象大模型XChat
元象XVERSE大模型驱动的AI聊天助手

百度灵医Bot
面向我国医疗健康产业推出领域增强的医疗行业大模型原生应用

曹植GPT大语言模型
曹植大语言模型是国内首个垂直行业专用的自主可控的国产GPT大语言模型,由达观数据研发。这个模型可以准确完成多类型、复杂结构的长文本写作,并自动起草多种类型的文档。未来,曹...

BenTsao本草
中文医学知识的大语言模型

华知大模型
由同方知网与华为强强联合打造的华知大模型,是一款针对知识服务和科研领域,以权威性和可信度为突出特点的内容平台。

MiniMax开放平台
MiniMax开放平台是国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型。这个平台由创业公司MiniMax构建,致力于通过搭建超大规模实验平台与推理平台,实现技术与产品...

阿里云百炼
阿里云百炼是基于通义大模型、行业大模型以及三方大模型的一站式大模型开发平台。
暂无评论...