热点资讯

你的位置:重庆时时彩对刷技巧 > 新闻动态 > 像DeepSeek的AI大佬,中国还有4家

像DeepSeek的AI大佬,中国还有4家


发布日期:2025-03-08 16:03    点击次数:104


作者 | 赵芷姗

编辑 | 汤安迪

DeepSeek的爆火,让网友们对DeepSeek充满了好奇。

不过,请先暂时将目光从DeepSeek身上移开,在中国,像DeepSeek这样的AI大佬,还有四家。

这个不是小编选出来的,是《麻省理工科技评论》杂志评选出的四家值得关注的中国AI初创公司,称其具备在中国国内和国外竞争的能力。

也许哪一天,它们就会像DeepSeek突然火遍全球。

智谱AI(Zhipu)

2019年,智谱由清华大学计算机系的技术成果孵化而来,致力于打造具有国际竞争力的人工智能大模型。

核心产品包括GLM系列大模型、MaaS平台以及面向C端的智谱清言App。

其中最新通用大模型GLM-4系列性能相比前一代全面提升60%,逼近GPT-4。智谱清言App拥有超过2500万用户,年化收入超千万。

根据官网信息,智谱已与荣耀、三星、英特尔等企业达成合作。

11日,三星发布发布旗舰手机Galaxy S25系列国行版,新增的AI视频通话功能,可以让用户和手机进行智能互动,其背后依靠的正是是智谱GLM-Realtime模型,拥有视频理解、语音交互与多轮记忆的能力。

另外,使用三星S25系列手机搜索时,会直接调用智谱清言智能体进行搜索。

智谱已于去年年底完成了D++轮投资,在这四家AI公司中实力最雄厚。

阶跃星辰(Stepfun)

阶跃星辰于2023年在上海成立,创始人是前微软高级副总裁姜大昕,他在微软期间主导了多个知名产品的研发,包括微软搜索引擎必应、智能语音助手Cortana以及Microsoft 365等。

核心团队个个来头都不小,系统负责人朱亦博是大模型AI基础设施专家,曾在微软、谷歌等公司工作;数据负责人焦斌星是前微软必应引擎核心搜索团队负责人。

阶跃星辰的代表模型是Step系列,目前语言大模型已经更新至Step-2万亿参数语言大模型,该模型在LiveBench上的表现仅次于ChatGPT、DeepSeeK、Claude和Gemini的模型。

多模态大模型更新至Step-1V千亿参数图片理解大模型,支持多轮指令跟随,精准识别。

它有两个面向C端的核心产品,一个是AI聊天平台“跃问”,另一个是AI角色扮演类产品“冒泡鸭”。

巧了不是,DeepSeeK的logo是鲸鱼,跃问的logo是海豚,都在同一片海洋里。

去年年底,阶跃星辰已获得数亿美元的B轮投资,投资方包括上海国投集团旗下的Fortera Capital、腾讯投资、五源资本、启明创投等。

面壁智能(ModelBest)

跟智谱一样,面壁智能也是一家“清华系”AI公司。

2021年,清华大学计算机系长聘副教授刘知远牵头成立了面壁智能,2022年北京面壁智能科技有限责任公司正式成立。

面壁智能CTO曾国洋出生于1998年,学生时代一路竞赛报送至清华,可以说是少年天才。面壁智能联合创始人、CEO李大海曾是谷歌中国创始员工之一,知乎合伙人。

核心技术团队成员来自国内自然语言处理研究顶尖实验室,均具有知名大学博士和硕士研究生学历。团队的“清北”含量高达80%,此外还有来自阿里、字节、百度等一线公司的骨干。

旗下产品主要有AI Agent智能体应用与端侧模型“小钢炮”MiniCPM,以较小的参数量实现了与更大模型相当的性能,推理速度更快,能耗更低。

MiniCPM-o 2.6一经开源,连续霸榜 GitHub Trending 榜单 4 天。仅 8B 参数,MiniCPM-o 2.6 可以持续看、实时听、自然说,开启实时流式、端到端的丝滑交流,堪称端侧 GPT-4o。

去年6月,有新闻曝出斯坦福大学AI团队主导的Llama3-V开源模型,被证实套壳抄袭面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V2.5,让面壁智能在圈内小火了一把。

斯坦福Llama3-V团队的两位作者在社交平台上就抄袭行为向面壁智能团队正式道歉,并表示会将Llama3-V模型悉数撤下。

目前面壁智能已完成A+轮融资,投资方包括清科创投、龙芯创投。

无问芯穹(Infinigence AI)

无问芯穹成立于2023年5月,同样是一家由清华大学电子工程系推动成立的AI基础设施企业。核心团队汇集了来自清华大学、北京大学、上海交通大学等顶尖学府的人才。

公司推出的产品包括Infini-AI云平台、一站式AI平台(AIStudio)、大模型服务平台(GenStudio)等,旨在为用户提供从算力、模型到应用的一站式服务。

无问芯穹提出了一个AI模型算力公式:芯片算力×优化系数(软硬协同)×集群规模(多元异构)= AI模型算力。这个公式强调了软硬件协同设计和多元异构适配在产业链中的价值。

无问芯穹的核心理念是“MxN”,即通过软硬件协同优化,实现多种模型和芯片的整合统一。公司希望通过提供高效的异构算力资源平台和中间件,大幅提升主流硬件和异构硬件的利用率。

在商业模式上,无问芯穹选择了不同于传统的软件付费模式,而是成为了一个“淘宝”式的智算领域运营商。公司将软件嫁接在各种集群的硬件基础之上,通过销售tokens来盈利。

目前,DeepSeek R1&V3推理服务已经上线无问芯穹。

去年9月,无问芯穹获得了近5亿人民币的A轮融资,投资方包括小米集团、启明创投等。