科大讯飞星火大模型:传媒领域评测夺冠,翻译能力傲视群雄

时间:2024-09-23 02:13:43
编辑:

7月4日消息,一份由多所顶尖高校教授指导,并由北京智源研究院、中国经济传媒协会与新京报联合发布的《大语言模型传媒方向能力测评调研报告》已经出炉。这份报告深入评估了大语言模型在传媒领域的表现,其中包括了模型的文本生成、翻译、事实核查以及媒体信息检索等方面的能力。

科大讯飞星火大模型:传媒领域评测夺冠,翻译能力傲视群雄

测评报告涵盖了包括讯飞星火、文心一言、通义千问在内的9大国内主流大模型产品。

报告的评估体系涵盖了文本生成、事实核查与价值观判断、媒体信息检索、翻译能力以及长文本处理等五个关键能力维度,全面反映了媒体行业对AI技术的需求和期待。

值得注意的是,如果将本次测评报告中所有五项维度的平均分进行横向比较,大模型的翻译能力得分6.42排名第一,在这一单项评测中,讯飞星火得分6.84排名第一。

作为人工智能“国家队”成员,科大讯飞星火大模型在传媒方向能力评测中取得这一成绩并不意外,尤其在智能翻译方面,科大讯飞有着深厚的技术积累和持续的技术创新。

在刚刚举行的国家科学技术奖励大会中,科大讯飞主导的《多语种智能语音技术及产业化》项目摘得国家科学技术进步奖一等奖,这是深度学习引发的新一代人工智能全球浪潮以来,人工智能项目首次荣获中国科技领域最高荣誉。

值得一提的是,本次贝壳财经峰会大模型评测报告的评测版本为讯飞星火V3.5,而在6月27日,科大讯飞全新发布了讯飞星火大模型V4.0,宣布全面对标GPT-4 Turbo,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现超越,在国内外中英文12项大模型主流测试集中,讯飞星火在其中8个测试集排名第一。

讯飞星火V4.0带来底座能力提升的同时,全新发布的星火企业智能体平台也成为备受传媒行业欢迎的大模型产品,智能体平台的“任务链”功能可以自动链接外部权威信源,“知识库”功能可以自动链接企业内部知识系统,打通内外信息鸿沟。

媒体人士表示:无论内部信息的纵向挖掘,还是外部信息的横向整合,智能体平台不仅提升媒体行业工作效率,对于从业人员的工作方式也将带来深远影响。

科大讯飞《讯飞晓医》App:全新升级,打造纯净医疗资讯体验

近日消息,在备受瞩目的2024世界人工智能大会(WAIC 2024)上,科大讯飞展示了其最新升级的“讯飞晓医”App。这款医疗健康领域的智能应用,凭借其独特的“个人数字健康空间”功能,吸引了众多参观者的目光。

科大讯飞《讯飞晓医》App:全新升级,打造纯净医疗资讯体验

据悉,上月底星火大模型 4.0 发布后,星火医疗大模型和讯飞晓医 App 也同步升级,号称医疗核心能力全面超过 GPT-4 Turbo 和 GPT-4o。

汇总该 App 主要信息如下:

官方介绍称,该 App 可在看病前进一步剖析病因、用药时给出药物禁忌个性判断、检查后联合对比给出数据变化,还可通过角色切换了解其他家庭成员健康状况。

其覆盖 1600 种常见疾病、2800 种常见药品、6000 种常见检查检验,能够满足用户看病前、用药时、检查后的核心场景健康需求。此外,该应用号称无广告、无混杂消息,且“高分通过”临床执业医师资格考试综合笔试测试。

工作人员表示,该 App 还通过了数据安全与隐私保护的多类权威认证,能够进一步保障健康数据的安全。其目标将是“打造每个人、每个家庭的 AI 健康助手”。

具体来看,其能够实现症状自查、药物查询、中医辨证、报告解读、医院推荐、科室推荐、饮食建议等功能。

相关攻略
相关推荐