据9月4日彭博社援引知情人士消息,DeepSeek正在开发一款具备更先进AI智能体功能的人工智能模型。该模型将能够在用户仅提供最少指令的情况下,代表用户完成多步操作,并能根据以往操作不断学习和改进。
DeepSeek创始人梁文峰正在推动团队,目标是在今年最后一个季度发布该新产品。今年1月,DeepSeek发布的R1模型以模拟人类推理过程的能力,颠覆了全球科技行业。8月21日,DeepSeek正式发布其新一代大语言模型DeepSeek-V3.1,并称其为“迈向Agent(智能体)时代的第一步”。
当前国内主流大模型的训练成本普遍在数千万至数亿美元级别,其中百度文心、阿里通义、腾讯混元等大厂模型投入最高,基本超2亿美元;而DeepSeek等通过技术优化降低训练成本,目前在3000-6000万美元之间。
数据显示,截至2024年Q1,我国人工智能大模型累计发布数量达478个。中国大模型数量排名仅次于美国,位居全球第二。
南开大学中国式现代化发展研究院中国新一代人工智能发展战略研究中心主任、南开大学经济研究所所长刘刚认为大模型正在重构人工智能技术体系,加速人智协同的生产方式和科学研究范式的到来。工业大模型对天津等地区很重要,可助力传统产业焕发新生机,壮大实体经济发展根基。
(责任编辑:admin)
关键词: