百川智能发布Baichuan 3：超越GPT-4的中文大语言模型新星

2024-01-29

软件资讯

来自：网络收集

　　1月29日消息，近日，由前搜狗公司CEO王小川创立的百川智能宣布推出了一款超千亿参数的大语言模型——Baichuan 3。据称，该模型在多项中文任务评测中表现优异，甚至在某些方面超越了GPT-4。

　　在逻辑推理能力的测试中，Baichuan 3展现出了强大的实力。无论是在MCMLE、MedExam还是CMExam等医疗领域的评测上，其中文效果均超过了GPT-4，被誉为“中文医疗任务表现最佳的大模型”。这一突破性的进展，无疑为中文医疗信息处理领域注入了新的活力。

　　据本站了解，为了训练出如此强大的模型，百川智能团队在Baichuan 3的训练过程中采用了多种创新技术手段和方案。其中包括“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等，这些技术的运用不仅保证了训练的稳定性，还大大缩短了故障恢复时间，据悉，故障恢复可在10分钟内完成。

　　除了在技术层面的突破，Baichuan 3还在语义理解和生成能力上进行了进一步的提升。通过“迭代式强化学习”技术，该模型在诗词创作方面展现出了惊人的实力。无论是五言律诗、七言绝句，还是“沁园春”、“定风波”等高难度的宋词文体，Baichuan 3都能生成工整对仗、韵脚和谐的作品，让每个人都能体验到诗词创作的乐趣。

　　百川智能作为一家成立不到一年的公司，能够在如此短的时间内推出这样一款领先的大语言模型，实属不易。目前，Baichuan 3大模型已经正式上线，并在百川智能官网上提供了试用服务。相信在不久的将来，这款模型将会在更多领域发挥出其强大的实力。

OPPO宣布Find X6系列等三款设备将迎来影像大升级，用户体验再提升

江铃福特烈马国产版正式发布，内外兼修

百川智能发布Baichuan 3：超越GPT-4的中文大语言模型新星

文章教程 分类

文章教程分类