澜舟依靠4两之力撬动千斤重的ToB场景。我们的10B参数的大模型足够胜任这个任务。

2024-03-19 热点资讯 关注公众号

衡宇 发自 凹非寺

量子位 | 公众号 QbitAI

专注、极致、口碑、快、成本。

这是澜舟科技创始人兼CEO周明给出的“大模型落地九字法则”,是他在雷军互联网“七字诀”的基础上,加上了“成本”一词而来。

他将2024年称为大模型落地元年,但同时坚定地表示,这并不意味着遍地是黄金。

而大模型的具体落地姿态,周明用自己带领的大模型创业团队澜舟科技身先士卒地做了个表率——利用澜舟“一横N纵”体系,以孟子大模型为基础,面向场景,发布产品。

简单来说,就是抓技术和应用的双轮驱动,在积极研究和掌握前沿技术的同时,致力于确保这些技术的有效应用。

3月18日的澜舟大模型技术和产品发布会现场,澜舟科技还与零一万物进行了战略合作签约。

现场,创新工场董事长、零一万物CEO李开复分享,目前世界上最好的大模型智能已经达到人类平均智力水平的3倍,也就是说,100道题普通人只能答对33道,而最好的AI大模型可以答对99道以上。

他展望了AI 2.0时代未来的四大趋势:

最革命性的AI 2.0应用应该是AI-First / AI-Native:最终脱颖而出的应用,属于那些敢于全力投入新技术的先驱者。大语言模型的引入为 AI-First 应用带来了巨大的推动力。

大模型始于文本,未来将拓展至“全模态”:跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种模态能力打通,例如文本-图像、文本-视频等跨模态甚至全模态的综合能力。

AI 2.0 将超越对话,从聊天工具到智能生产力工具:用户体验以及未来交互界面和商业模式都会发生大的变革。

AI 2.0 将走向实体,大幅提振社会生产力:具身智能可以让机器人制造机器人,进一步实现AI 2.0+生产线智能规划。

专注研发10B-100B参数大模型

澜舟科技成立于2021年6月,是国内最早一批下场,进行大模型创业的团队。

去年3月,澜舟发布了孟子GPT V1(MChat);今年1月,孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)对公众开放。

近期,澜舟团队完成了Mengzi3-13B的大模型训练。

多说一句,孟子大模型训练背后有个大功臣,即总规模3T tokens的Mengzi-3数据集,包含了网页、代码、书籍、论文等高质量数据来源。

据介绍,本月底(3月30日),Mengzi3-13B的模型将在GitHub、HuggingFace、魔搭和始智AI社区开源

为什么开源的孟子大模型,是13B版本的?周明正面回答了这个问题。

首先,澜舟明确以服务ToB场景为主,ToC为辅。

实践发现,ToB场景使用频率最高的大模型参数量多为7B、13B、40B、100B,整体集中在10B-100B之间。

其次,在这个区间范围内,从ROI角度来讲,既满足场景需求,又最具性价比。

所以很长一段时间内,澜舟的目标都是做好10B-100B参数规模范围内的行业大模型。这就不能理解为什么开源版本选择13B。

周明解释道,他自己本身其实也是Scaling law的信仰者,但创业不同于科研。

“第一,这个大小的大模型已经可以解决80%的问题;第二,对团队来说也比较稳定,不会因为不断扩大的模型规模竞赛而感到焦躁不安。”周明补充说,这样冷静的思考,可以保证良好的成本控制,避免无谓的GPU算力、数据、人力投入竞赛。

“一横N纵”体系

发布会上,澜舟公布了自己的一横N纵体系。

“一横”是模型层,是孟子大模型技术基础上研发的各个模型;

“N纵”则是基于孟子大模型的面向ToB应用最重要的技术和产品。

据了解,澜舟目前重点投入到了金融行业,辅助编程等领域,旨在通过更加全面、专业、优质的领域数据,打造更加贴近行业场景的垂直大模型。

以孟子GPT通用大模型的“一横”为基础,澜舟科技合伙人、首席产品官李京梅,介绍了澜舟的应用能力型产品,包括:

AI文档理解:涵盖专业的PDF文档解析能力和信息抽取能力,为RAG方案中的文档理解提供了更优的基础能力;

AI文档问答:根据企业需要,提供私有化企业智能知识库构建的解决方案能力;

AI文档辅助写作:支持用户上传多个文档作为参考资料,支持自定义多级题目和写作提纲,由大模型赋能自动化按要求生成完整的文章初稿;

机器翻译平台:专注以中文为中心的世界主要语种之间互译和20几个领域的专业翻译;

澜舟智会:专注会议的智能分析和问答的产品, 是基于大模型打造的大模型原生的智能会议助手;

澜舟AI搜索:大语言模型时代的搜索引擎。

过去一年,大模型领域日新月异。

OpenAI在干什么我们就去干什么,短期可以,长期不可取,一定要有自己的创新思路。

如何扬长避短,走出自己的独特的创新之路,周明表达了自己的看法。

最关键的第一步,就是企业要有明确定位。澜舟科技的定位就和国内其它大模型创业公司有明显差异。

他举例,澜舟的定位就是作“大模型技术+企业场景应用”的综合公司,“我们希望能做到站在技术角度最懂应用,站在应用角度最懂技术,同时又希望把技术和应用形成一种生态连接在一起,让两边可以快速迭代。”

同时,依然需要聚焦和抓紧落地——通过落地,创造价值,拉动创新。

而且需要注意,创新和落地是相辅相成的。

不要一味的创新或者一味的落地,要把这两者联系在一起,让它快速的迭代。

最后周明还语重心长地提醒:

今年是大模型落地元年,就遍地是黄金是吗?不是的,我可以负责任地说,很多地方我们都没有开拓出来。

比如大模型如何解决落地的最后一公里?大模型的商业模式是什么?如何加强交付能力?如何提高产品的商业化?

大模型落地的一切,其实才刚刚开始。


总结:本文中,周明提出了“大模型落地九字法则”。他认为,这并不是“遍地是黄金”,而是需要坚持科技创新,并有效解决落地问题。
1. 时间:2024年将是大模型落地元年,但是这并不意味着我们应该盲目乐观。相反,我们需要保持谨慎的态度,因为并非所有的应用都可以通过大规模的大模型来应对。
2. 技术与应用的双重驱动:他强调了技术创新和技术应用的重要性。只有充分理解和掌握先进技术,才能将其有效地应用于实际应用场景中。
3. 开源:孟子大模型经过多次公开,已经得到了市场的认可。因此,开源大模型不仅可以帮助他人,也可以提高大模型技术的可扩展性和公信力。
4. 应对挑战:在面对大模型落地的挑战时,周明也给出了自己的见解。他强调了团队之间的合作,以及如何平衡风险和收益,以实现大模型落地的成功。
5. 决策模式:最后,周明提到了一个重要的观点:“创新和落地是相辅相成的”。他提醒大家,不能一味的创新或者一味的落地,而是要在两者之间找到平衡,使其能够迅速迭代和发展。

上一篇:别再找外星人了,现在科学家们都在做这些事
下一篇:菠萝和凤梨到底是不是同一种水果?
更多更酷的内容分享
猜你感兴趣
了解并掌握命运方舟觉醒任务攻略,助力游戏成就辉煌之路

了解并掌握命运方舟觉醒任务攻略,助力游戏成就辉煌之路

"命运方舟觉醒任务攻略的注意事项包括:合理分配资源、应对突发情况和把握关键信息等。"

热点资讯 04.19
构建ToB产业的新型数据底座:探讨大模型时代的挑战与机遇

构建ToB产业的新型数据底座:探讨大模型时代的挑战与机遇

大型人工智能模型需庞大数据支持,如仅500T参数模型需使用16.6PB数据,现有数据量暴增使预训练和微调需求增大。数据处理与隐私风险逐渐显现,企业应对框架、挑战与技术栈进行深入探索。同时,应把握机会融入公共资源,以解决数据供给难题。

热点资讯 05.12
国内首个开源千亿参数MoeE大模型惊艳上线:瞄准特斯拉的Grok技术挑战

国内首个开源千亿参数MoeE大模型惊艳上线:瞄准特斯拉的Grok技术挑战

当前国内将迎来首个万亿参数大模型。国内独角兽企业APUS联合新旦智能训练的大模型APUS-xDAN预计将在近期开源。此外,APUS-xDAN还能适配4090低端算力。据报道,美国针对中国高端人工智能芯片修订相关法规,将加大对中国产品的出口难度。此次APUS-xDAN大模型4.0(MoE)的背后,有来自独角兽企业的投资,同时还有两家初创公司APUS和新旦智能的合作研发。APUS成立于2014年,现转型为人工智能和大模型,APUS-xDAN有望成为中国第一款百万参数大模型。

热点资讯 04.01
挑战GPT-4:大模型们的强大之处与潜在风险

挑战GPT-4:大模型们的强大之处与潜在风险

最近,一家国内大模型算法工程师在接受采访时吐槽:“大家相互薅羊毛,要用,但要小心用,一不小心就尴尬了。”

热点资讯 04.20
拼多多高管黄峥财富缩水超两万亿,遭钟睒睒炮轰增长放缓

拼多多高管黄峥财富缩水超两万亿,遭钟睒睒炮轰增长放缓

拼多多第三季度营收增长,净利润下降,公司CEO黄峥财富缩水,市场份额受到质疑,拼多多面临长期挑战。 拼多多创始人黄峥财富缩水,拼多多面临巨大挑战,市场份额面临质疑。

热点资讯 11.23
京东方联手燕东微启动12英寸晶圆项目,争夺中国半导体市场份额的关键之战

京东方联手燕东微启动12英寸晶圆项目,争夺中国半导体市场份额的关键之战

京东方与燕东微计划共同出资70亿元,投资建设12英寸晶圆生产线项目,将填补国内高端晶圆市场供给缺口,推动中国集成电路产业的发展,并助力北京产业升级。其中,燕东微将持股51%,而京东方则占股49%。这一项目的总投资预计将在2024年启动,2026年底实现量产,2030年达到满产,以满足高端12英寸晶圆市场的需求。该项目对京东方和燕东微来说都是重要的战略布局,也有助于推动国内集成电路产业的发展。

热点资讯 11.23
金融帝国:探讨‘疯狂’的商业银行商业模式与前景

金融科技风暴:商业银行的新角色和未来趋势分析

金融帝国:探讨‘疯狂’的商业银行商业模式与前景 金融科技风暴:商业银行的新角色和未来趋势分析

不多于五次。这些存款产品通常被视为短期贷款,且流动性较差。此外,由于监管要求金融机构必须遵守信用风险和风险管理规定,故商业银行可能被迫降低或取消此类业务。目前,在这些内卷化的银行业中,存在着一些违规行为和不公平现象。例如,一些银行过度追求市场份额,导致过度借款,最终可能导致资产损失;同时,部分银行则为了获得更高的收入而采取不正当的揽储策略,包括使用“现金贷”等。这些问题对于金融市场的稳定性和政府的调控都构成了威胁。因此,应当加强对银行业金融机构的监管力度,打击各种形式的违规行为,保障银行的稳健经营和发展。

热点资讯 11.23
蒋凡回归,开启全新篇章

蒋凡回归,开启全新篇章

阿里巴巴集团CEO吴泳铭宣布成立阿里电商事业群,任命蒋凡担任CEO,全面整合淘宝天猫集团、国际数字商业集团等业务,预计将进一步提升阿里在电商界的竞争地位。

热点资讯 11.23
业内消息:OpenAI正与三星洽谈合作,进军人工智能领域

业内消息:OpenAI正与三星洽谈合作,进军人工智能领域

OpenAI正与三星洽谈合作,有望在Galaxy手机中搭载多项AI功能。

热点资讯 11.23
国家数据局:到2029年基本建成国家数据基础设施主体结构 | 银河通用机器人获5亿元战略融资

更改为:国家数据局发展规划: 2029年建成国家数据基础设施主体结构 | 银河通用机器人获得5亿战略融资

国家数据局:到2029年基本建成国家数据基础设施主体结构 | 银河通用机器人获5亿元战略融资 更改为:国家数据局发展规划: 2029年建成国家数据基础设施主体结构 | 银河通用机器人获得5亿战略融资

75G

热点资讯 11.23
越南电商公司Shein因假货争议受阻,东南亚各国强化跨境电商监管

越南电商公司Shein因假货争议受阻,东南亚各国强化跨境电商监管

在中国和新加坡两国的支持下,泰国电子商务巨头Shopee正在与越南工贸部洽谈业务注册事宜。然而,由于缺乏必要的手续,Shopee等跨境电商平台将在越南结束业务,并面临被封锁的应用程序及域名的问题。虽然部分博弈已完成,但一旦注册失败,将对企业造成严重影响。此外,电商平台还需面对来自东南亚其他国家的监管加强。因此,电商平台必须做好充分准备,以应对可能出现的挑战。

热点资讯 11.23
探讨电商与汽车企业家的智慧与盲目:我选择圆润幸福的企业之路

探讨电商与汽车企业家的智慧与盲目:我选择圆润幸福的企业之路

"胖东来创始人于东来表示要活得圆润幸福,并呼吁大家少走弯路,活出自己的美好。"

热点资讯 11.23
小米将承担 SU7 自动泊车异常维修费用/麦当劳和支付宝力推「碰一下点餐」/OpenAI 正考虑推出自研浏览器

小米将承担 SU7 自动泊车异常维修费用/麦当劳和支付宝力推「碰一下点餐」/OpenAI 正考虑推出自研浏览器

苹果正在研发更智能的新版Siri谷歌被要求强拆Chrome浏览器和Android系统美国司法部已向联邦法院提出请求,要求谷歌出售其Chrome浏览器和可能的Andr 这个文本概括了两个主要事件:苹果正在研发新的Siri;谷歌被要求强制拆解Chrome浏览器和Android系统。同时,还提到了中美之间的司法纠纷以及可能出现的其他消息或声明。

热点资讯 11.23
32岁的叶珂线下生图曝光:气质女神形象全貌展示

32岁的叶珂线下生图曝光:气质女神形象全貌展示

黄晓明已经有过多名前女友,如果叶珂的颜值真的超过她们的话,可能会吸引一些粉丝的关注。但是从现在的评论来看,大部分网友对叶珂并不满意,认为她在颜值和身材上存在水分,而且还是通过整形等方式获得的。最近,又有几张叶珂看演唱会的线下生图在网上曝光,这张照片中她身穿黑色礼服,留着披肩长发,脚踩高跟鞋,看起来十分专业和优雅,但与精修照相比仍然有所差距。

热点资讯 11.23