丝袜控智源商讨院林咏华：多模态模子需求隆盛，但基础才气仍有擢起飞间

发布日期：2024-12-23 14:33 点击次数：162

（原标题：智源商讨院林咏华：多模态模子需求隆盛丝袜控，但基础才气仍有擢起飞间）

21世纪经济报谈记者雷晨北京报谈

本年下半年以来，大模子履历了粗暴的淘汰赛，少数用户活跃度高的大模子脱颖而出，干涉决赛圈。与此同期，各界关于这些模子的性能发达、发展后劲等方面的神色突飞猛进。

色吧

近期，北京智源东谈主工智能商讨院（简称：智源商讨院）发布并解读了国表里100余个大模子的详细及专项评测欺压，涵盖说话、视觉说话、文生图、文生视频、语音说话等多个限制。

围绕大模子发展趋势、行业近况及有关热门问题，智源商讨院副院长兼总工程师林咏华与21世纪经济报谈等媒体进行了一场深度对话，从专科视角对大模子的发展趋势、行业近况以及有关热门问题进行剖释。

互联网大厂上风彰着，模子发展仍具后劲

林咏华指出，互联网大厂在大模子限制具有权贵上风。在说话模子方面，凭借坚强的流量上风，大厂能得回更多用户响应，激动数据飞轮，在主不雅评测中发达细腻。举例字节、快手等公司，在文生图、文生视频限制，因本身短视频平台积蓄的高质地数据而出奇于非互联网厂商。

针对前OpenAI连合创举东谈主、SSI创举东谈主Ilya提议的预磨真金不怕火停滞不雅点，林咏华赐与反驳。她示意，现时互联网存在数据孤岛景色，大宗数据未被充分讹诈，汉文数据在民众占比下落，但使用汉文上网东谈主数未变。同期，海量视频数据也有待挖掘，以促进模子对寰球的默契学习，大模子发展仍有远大后劲。

模子发展态势分化，多模态后劲突显

智源评测欺压自大，2024年下半年大模子发展呈现新趋势：多模态模子发展赶快，新厂商与新模子束缚涌现，在K12学科测试中，和会说话和视觉的多模态模子发达出色，其领会和推理才气更强。说话模子发展则相对放缓，开源的第一梯队模子已达到较高水平，不时擢升需更多调动，模子尺寸出现南北极分化，除大型繁多模子外，7B或以下小模子下载量也较高。

林咏华以为，多模态模子需求隆盛，但基础才气仍有擢起飞间，忖度2025年将有更多新模子出现。关于资金不彊但调动才气足的团队，可在多模态模子的拼接、预经管、后经管、学习模式等方面进行调动。

AI应用趋势明确，算力需求将擢升

林咏华还对AI应用趋势进行了预测。她示意，2024年说话模子基础才气擢升，激动了复杂应用发展，2025年基于说话模子的Agent将成为热门，用于构建更复杂的AI应用和系统。文生图、文生视频应用也将在2025年迎来发展，VLM多模态模子在企业的落地场景平淡，昔时需擢升基础才气以造成新应用。

跟着模子发展，对算力需求也将变化。林咏华提到，端侧模子正在发力，昔时端云链接将成趋势，小模子和大模子将辨认承担不同责任，以均衡资源浪掷与后果擢升。

开源生态捏续发展，国表里差距仍存

在模子开源生态方面，除了坚强开源的机构外丝袜控，新的开源孝顺者束缚出现。林咏华同期指出，中国在大模子手艺限制与海外先进水平比较，在数据和AI系统方面存在差距，包括万般数据资源及算力。昔时，国内需加强数据诞生，擢升算力水平，以激动大模子手艺的进一步发展。

丝袜控 智源商讨院林咏华：多模态模子需求隆盛，但基础才气仍有擢起飞间

丝袜控智源商讨院林咏华：多模态模子需求隆盛，但基础才气仍有擢起飞间