人工智能_DeepSeek领衔_国产大模型竞争力加速迭代
文章目录
计算机
报告日期:2025 年 02 月 02 日
DeepSeek 领衔,国产大模型竞争力加速迭代人工智能行业点评报告
投资要点
近期,DeepSeek 发布 DeepSeek-R1 模型及多模态框架 Janus-Pro、JanusFlow,模型在小参数、低成本的情况下展现出色的综合性能,腾讯云、华为云以及微软、英伟达等厂商相继上线 DeepSeek 模型服务。同时,阿里、字节发布最新多模态模型,国产大模型竞争力持续迭代下商业应用有望加速落地。
DeepSeek 发布多款模型并登陆国内外头部云厂平台,商业应用有望迎来爆发
1 月 20 日,DeepSeek 正式发布 DeepSeek-R1 模型并同步开源模型权重。在模型极少标注数据的情况下,模型在数学、代码、自然语言推理等任务上性能可比肩OpenAI o1 正式版,同时 DeepSeek-R1 蒸馏小模型表现优于 OpenAI o1-mini。DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元,相较于 o1、o1-preview 模型的价格降低了 $90%$ 以上。近日腾讯云、华为云宣布已上线基于其云服务的 DeepSeek-R1 相关服务。微软、英伟达、亚马逊、AMD 等厂商也已上线 DeepSeek 模型服务。
1 月 28 日,DeepSeek 发布多模态框架 Janus-Pro 和 JanusFlow,其中 Janus-Pro 是一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能。其中,Janus-Pro 的 SigLIP 编码器专门负责理解图像,能提取图像的高层语义特征,并关注图像的整体含义和场景关系;而VQ tokenizer 编码器,专门用于创作,将图像转换为离散的 token 序列,这样架构创新使得 Janus-Pro 在 7B 参数规模下,仅用 32 个节点、256 张 A100 和 14 天的时间就完成训练并取得出色性能表现。
阿里开源视觉 AI Agent 模型 Qwen2.5-VL,可自动化操作电脑、手机
1 月 28 日,阿里巴巴发布了最新视觉多模态模型 Qwen2.5-VL,与之前版本相比,除了在图像、文本、视频的理解、识别能力更强之外,Qwen2.5-VL 最大特色就是可以直接作为一个视觉 Agent 自动化操作电脑、手机。除 Agent 能力外,Qwen2.5-VL 升级了视频理解能力,通过 FPS 训练和绝对时间编码技术,能理解超长视频,定位秒级事件,还能在长视频中搜索具体事件、总结不同时段要点,帮用户快速提取关键信息。
豆包推出实时语音大模型,在情感理解和情感表达等方面取得显著进展
豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话,主要面向中文语境和场景。依托于语音和语义联合建模,该模型呈现出接近真人的语音表达水准,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
建议关注标的
行业评级: 看好(维持)
分析师:刘雯蜀执业证书号:[email protected]
分析师:陶韫琦执业证书号:[email protected]
相关报告
1 《OpenAI 发布 Operator,AI智能体实现跨越式进步》
2025.01.24
2 《机构持股比例拐点向上 算力、鸿蒙获得增持》 2025.01.243 《豆包端到端语音功能上线,双商在线表现力极佳》
2025.01.20
免责申明:
- 本资料来源于网络公开渠道,版权归属版权方;
- 本资料仅限会员学习使用,如他用请联系版权方;
- 会员费用作为信息收集整理及运营之必须费用;
- 如侵犯您的合法权益,请联系客服微信将及时删除
行业报告资源群
- 进群福利:进群即领万份行业研究、管理方案及其他学
习资源,直接打包下载 - 每日分享:6份行研精选报告、3个行业主题
- 报告查找:群里直接咨询,免费协助查找
- 严禁广告:仅限行业报告交流,禁止一切无关信息
微信扫码,长期有效
知识星球 行业与管理资源
专业知识社群:每月分享8000+份行业研究报告、商业计划、市场研究、企业运营及咨询管理方案等,涵盖科技、金融、教育、互联网、房地产、生物制药、医疗健康等;已成为投资、产业研究、企业运营、价值传播等工作助手。
AI Agent 应用:科大讯飞、焦点科技、鼎捷数智、彩讯股份、迈富时、拓尔思、泛微网络;
AI 垂类应用:金山办公、万兴科技、昆仑万维、虹软科技、润达医疗、美图公司、商汤-W;
❑ 风险提示
1、AI 技术迭代不及预期的风险;2、AI 商业化产品发布不及预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险;
免责申明:
- 本资料来源于网络公开渠道,版权归属版权方;
- 本资料仅限会员学习使用,如他用请联系版权方;
- 会员费用作为信息收集整理及运营之必须费用;
- 如侵犯您的合法权益,请联系客服微信将及时删除
行业报告资源群
- 进群福利:进群即领万份行业研究、管理方案及其他学
习资源,直接打包下载 - 每日分享:6份行研精选报告、3个行业主题
- 报告查找:群里直接咨询,免费协助查找
- 严禁广告:仅限行业报告交流,禁止一切无关信息
微信扫码,长期有效
知识星球 行业与管理资源
专业知识社群:每月分享8000+份行业研究报告、商业计划、市场研究、企业运营及咨询管理方案等,涵盖科技、金融、教育、互联网、房地产、生物制药、医疗健康等;已成为投资、产业研究、企业运营、价值传播等工作助手。
股票投资评级说明
以报告日后的 6 个月内,证券相对于沪深 300 指数的涨跌幅为标准,定义如下:
1.买 入 :相对于沪深 300 指数表现 $+20%$ 以上;
2.增 持 :相对于沪深 300 指数表现 $+10%\sim+20%$ ;
3.中 性 :相对于沪深 300 指数表现 $-10%\sim+10%$ 之间波动;
4.减 持 :相对于沪深 300 指数表现- $10%$ 以下。
行业的投资评级:
以报告日后的 6 个月内,行业指数相对于沪深 300 指数的涨跌幅为标准,定义如下:
1.看 好 :行业指数相对于沪深 300 指数表现 $+10%$ 以上;
2.中 性 :行业指数相对于沪深 300 指数表现 $-10%\sim+10%$ 以上;
3.看 淡 :行业指数相对于沪深 300 指数表现- $10%$ 以下。
我们在此提醒您,不同证券研究机构采用不同的评级术语及评级标准。我们采用的是相对评级体系,表示投资的相对比重。
建议:投资者买入或者卖出证券的决定取决于个人的实际情况,比如当前的持仓结构以及其他需要考虑的因素。投资者不应仅仅依靠投资评级来推断结论。
法律声明及风险提示
本报告由浙商证券股份有限公司(已具备中国证监会批复的证券投资咨询业务资格,经营许可证编号为:Z39833000)制作。本报告中的信息均来源于我们认为可靠的已公开资料,但浙商证券股份有限公司及其关联机构(以下统称“本公司”)对这些信息的真实性、准确性及完整性不作任何保证,也不保证所包含的信息和建议不发生任何变更。本公司没有将变更的信息和建议向报告所有接收者进行更新的义务。
本报告仅供本公司的客户作参考之用。本公司不会因接收人收到本报告而视其为本公司的当然客户。
本报告仅反映报告作者的出具日的观点和判断,在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议,投资者应当对本报告中的信息和意见进行独立评估,并应同时考量各自的投资目的、财务状况和特定需求。对依据或者使用本报告所造成的一切后果,本公司及/或其关联人员均不承担任何法律责任。
本公司的交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。本公司没有将此意见及建议向报告所有接收者进行更新的义务。本公司的资产管理公司、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。
本报告版权均归本公司所有,未经本公司事先书面授权,任何机构或个人不得以任何形式复制、发布、传播本报告的全部或部分内容。经授权刊载、转发本报告或者摘要的,应当注明本报告发布人和发布日期,并提示使用本报告的风险。未经授权或未按要求刊载、转发本报告的,应当承担相应的法律责任。本公司将保留向其追究法律责任的权利。
浙商证券研究所
上海总部地址:杨高南路 729 号陆家嘴世纪金融广场 1 号楼 25 层
北京地址:北京市东城区朝阳门北大街 8 号富华大厦 E 座 4 层
深圳地址:广东省深圳市福田区广电金融中心 33 层
上海总部邮政编码:200127
上海总部电话:(8621) 80108518
上海总部传真:(8621) 80106010
浙商证券研究所:https://www.stocke.com.cn
文章作者 大模型
上次更新 2025-03-09