这5种隐形高热量食物别多吃:很多人都没注意

快科技4月24日消息,生活中有很多食物自带健康滤镜,但其实际热量却高得惊人。比如深受大众喜爱的鸡爪,虽然看着没什么肉,但其实含有极高的油脂。

啃下两个鸡爪所摄入的热量,在某种程度上几乎等同于吃了两碗米饭。这种高脂肪、高热量的零食,往往在不经意间破坏了人们的减脂计划。

看起来健康的果蔬脆片,其加工过程多为低温油炸,本质上与油炸薯片没有太大区别。一百克普通果蔬脆片的热量高达四百至五百五十大卡,几乎接近一顿正餐的能量水平。

为了改善粗粮饼干粗糙的口感,商家在加工过程中往往会添加大量的油脂和糖分。所谓的健康粗粮,在这些重油重糖的辅料加持下,反而变成了名副其实的热量炸弹。

鲜榨果汁常被视为补充维生素的佳品,但由于在压榨过程中去除了宝贵的膳食纤维,剩下的其实大多是糖分。一杯五百毫升的纯橙汁,其热量往往会超过两百大卡。

腐竹是豆制品中的热量冠军。每一百克泡发后的湿腐竹热量约为两百千卡,是同等重量豆腐的两倍以上,其热量密度甚至超过了一碗普通的白米饭。

除了热量陷阱,饮食中的温度同样关系到健康。国际癌症研究机构已经将六十五摄氏度以上的热饮列为二A类致癌物。

长期饮用六十五摄氏度以上的高温液体,会反复烫伤食道黏膜并引起慢性炎症,从而显著增加罹患食道癌的风险。在日常生活中,那些习惯趁热吃、趁热喝的做法其实潜藏着严重的健康隐患。

这5种隐形高热量食物别多吃:很多人都没注意

Continue Reading这5种隐形高热量食物别多吃:很多人都没注意

MATLAB 和 Simulink R2026a 推出全新 Agentic AI 驱动的工作流

MathWorks 今日宣布,推出

利用 MATLAB MCP Core Server 推进 Agentic AI 工作流

随着生成式 AI 能力的不断发展,MathWorks 正致力于将 Agentic AI 与现有工具链深度集成,以支持可控、可追溯、可重复的软件与系统开发工作流。

在中国,工程师可以使用 MATLAB Model Context Protocol(MCP)工具(Tools)来构建并集成基于 Agentic AI 的工作流。这些工具使 AI 智能体(例如,Coding Agent)直接与 MATLAB/Simulink 交互,从而超越传统的聊天式辅助设计,迈向以行动为导向的智能型、自动化工作流。

借助 MATLAB MCP Core Server,AI 智能体可以调用 MATLAB 和 Simulink 来执行诸如代码生成、代码执行、代码分析、迭代优化以及模型创建、模型编辑/修改、模型理解等任务。这种方式使生成式AI不仅能够提出解决方案建议,还能够在实时的 MATLAB/Simulink 环境中执行、评估并不断迭代工程任务,从而实现生成式 AI 与可验证计算之间的闭环。更多信息,请查阅 MATLAB Agentic AI 指南 – MATLAB & Simulink

MATLAB Agentic Toolkit 与 Simulink Agentic Toolkit

Coding Agent可以生成 MATLAB 和 Simulink 代码,但要获得高效且符合 MATLAB/Simulink 习惯的结果,仍然需要领域特定的上下文和最佳实践作为支撑。如果缺乏相应指导,Coding Agent可能会重复实现已有的工具箱功能、忽视内置特性,或采取一些经验丰富的 MATLAB 或 Simulink 用户通常会避免的冗余步骤。

MATLAB Agentic Toolkit 和 Simulink Agentic Toolkit 通过向 Coding Agent 提供 MATLAB 与 Simulink 工作流及使用规范的专家级知识,对 MATLAB MCP Core Server 形成有力补充。二者结合后,使生成式 AI 系统能够:

编写符合 MATLAB/Simulink 风格的代码或模型

自动生成并运行测试

诊断和修复错误

更高效地利用 MATLAB 和 Simulink 的内置能力

同时,还能在提升工程结果质量的基础上,减少不必要的Token开销。更多信息,请访问 https://github.com/matlab/

针对嵌入式软件质量的 Polyspace 增强功能

R2026a 推出新产品 Polyspace as You Code,为嵌入式软件工程师提供端到端解决方案,覆盖从开发到持续集成流水线的代码分析与测试。Polyspace as You Code 是面向主流 IDE 的插件,可在编写代码的同时检查 C 与 C++ 编码规则并检测缺陷。

R2026a 还发布了全新的 Polyspace 桌面应用,用于在各类 Polyspace 工具之间统一进行配置与结果管理。Polyspace Bug Finder 现可扩展自定义检查器与编码标准;Polyspace Test 新增软件净化能力,用于对运行时错误开展动态分析。上述增强使嵌入式软件团队能够在统一工作流内完成软件质量活动,产出更安全、更可靠、更易维护的代码。

R2026a 中的其他产品与关键更新

R2026a 还为多款常用 MATLAB 与 Simulink 工具带来新产品与重要更新,包括:

MATLAB Course Designer – 帮助教育工作者使用 MATLAB 与 Simulink 开发课程、课件、实验与练习的新产品。

MATLAB – 无需安装 MATLAB 即可构建并分享带可视化的交互式网页。工程师可管理 Python 环境,并改善 MATLAB 与 Python 工作流之间的数据交换。

Simulink – 通过简化、以任务为导向的上下文菜单,更高效地访问常用操作。该更新还允许在模型中仿真 C 与 C++ 代码,没有语言限制也无需额外的包装器。

Simulink FMU Builder – 从 Simulink 模型以及 C 或 C++ 代码创建独立的功能模型单元,以支持模型交换与集成工作流。

Wireless Network Toolbox – 对无线通信网络进行建模、仿真、分析与可视化,以评估端到端系统行为。

MATLAB Test – 生成起始测试、等效性测试以及基于命令历史创建测试;并可运行与当前文件相关的测试,减少不必要的执行。

Mapping Toolbox – 通过 3D 建筑可视化、图像叠加与栅格地图能力增强地理空间分析。

Signal Processing Toolbox – 使用全新的滤波器设计工具与滤波器分析器设计与分析数字滤波器;为时频数据添加标签,并通过增强的交互式工具提取信号特征。

Continue ReadingMATLAB 和 Simulink R2026a 推出全新 Agentic AI 驱动的工作流

星宸科技登陆2026北京车展

星宸科技(SigmaStar)正式亮相于4月24日至5月3日举办的2026北京国际汽车展览会B2馆-C25展位,展出面向智能汽车领域的完整芯片与解决方案矩阵。

依托在视觉感知、激光雷达、AI算力、车规芯片等领域的深厚积累,星宸科技本次带来视觉感知辅助驾驶、激光雷达、智能车灯、AI Box大模型硬件平台、两轮智能座舱仪表等多场景车载解决方案,并同步展示星帷ISP 6.0与StarShuttle 4.0两大核心技术及众多联合解决方案,以高集成、低功耗、国产化车规级能力,为全球车企与Tier1提供更具竞争力的技术支撑。

四轮车辅助驾驶芯片:SAC8905领衔舱驾一体,SAC8712主攻前视一体机

面向四轮车辅助驾驶应用,星宸科技推出SAC8905与SAC8712。其中SAC8905面向高阶辅助驾驶与舱驾一体,NPU算力达32TOPS,支持8路Camera接入,为L2+系统提供高算力、低功耗的国产车规级选择,已获Global OEM定点,预计2027年Q2量产。

SAC8712主攻前视一体机场景以及自动紧急制动系统(AEBS),在前视一体机场景下功耗低于3.5W,目前已导入国内头部OEM并获ASIL-B认证。

四轮车舱内辅助系统芯片:SAC8901/8902均已量产上车

在舱内辅助感知场景,星宸科技SAC8901与SAC8902可支持驾驶员监测、乘客识别及舱内儿童遗留检测等DOMS应用。其中,SAC8901典型功耗低于300mW,并内置DDR,芯片集成度高,适合系统结构的紧凑设计;此外,SAC8901已通过AEC-Q100 Grade2认证,满足DDAW、ADDW及ENCAP法规。

SAC8902支持三屏异显及双路3M@60fps输入,可实现夜视增强,片内延时小于10ms;此外,SAC8902已通过GB15084-2022认证。目前,两款芯片均已量产上车。

两轮车座舱系统芯片:SSD2381/2386,累计发货超200万颗

星宸科技将智能座舱理念延伸至两轮车领域。SSD2381/2386系列芯片采用ARM CA55四核架构,支持Android 12及Linux,集成了仪表显示、导航投屏、行车记录及盲区预警功能,并集成安防级ISP与编码器。该系列在车载后装市场累计发货超200万颗,覆盖奔驰、宝马、奥迪等品牌,同时在扫地机器人及投影仪领域累计发货超2000万颗。

激光雷达SPAD SoC SS901xx

SS901xx是星宸科技首款车规级激光雷达SPAD SoC,面向长距线扫主雷达应用,具备性能更强、面积更小、功耗更低的优势。

关键指标:

SPAD阵列:588×90,通道数128/192/256/384/512可选

探测性能:最远300m(10%反射率),精度±0.03m,最小探测距离0.5m

PDE > 30% @905nm,车规级Pixel工艺

典型功耗 < 0.6W,芯片面积仅30mm2

点频:最高800万点/秒(192通道,24μs)

支持多颗芯片拼接,满足更高线数需求

核心技术:星帷ISP6.0 + StarShuttle 4.0

此次车展,星宸科技带来核心技术实拍演示,重点展示两大自研核心引擎。

星帷ISP6.0以“星帷织光,万象显影”为理念,实现从“增强”到“智能”的跨越式升级。

核心提升:

全新2DNR算法:可实现低照噪声抑制与细节保持的更优平衡,提升低照条件下的目标识别稳定性与整体图像质量

Tone和色彩系统升级:路灯收光更优,画面通透性强;色彩真实丰富,层次明显

运动防抖EIS:增强动态场景下的图像稳定性

HDR140dB:高动态范围,能够同时兼顾隧道外高亮区域和隧道内暗部区域的细节呈现

StarShuttle 4.0是星宸科技自研的NPU专用工具链,覆盖从0.1TOPS到512TOPS的全系列算力产品,满足DVR、DMS、OMS、CMS及L1/L2级组合辅助驾驶所有场景。

核心能力:

支持CNN、Transformer、LLM、VLA架构,兼容Caffe、TensorFlow、ONNX、HuggingFace

支持4/8/16bit混合量化,QAT-S一键量化,训练时间减少至1/10

访存效率提升35%,MAC利用率提升15%,指令存储压缩超50%

原生支持AWQ/GPTQ量化的大模型

五大联合解决方案

星宸科技同步展示了辅助驾驶、舱内辅助系统、整机方案、视觉辅助系统及激光雷达辅助驾驶系统五大联合解决方案,覆盖从感知到决策的关键环节。

未来,星宸科技将持续聚焦车规级芯片研发与技术创新,深化智能驾驶、智能灯控、两轮出行、激光雷达感知等领域布局,以全栈技术能力与开放生态合作,助力全球智能汽车产业高效升级。

欢迎各位业界伙伴于4月24日至5月3日前往首都国际会展中心(顺义馆)B2馆-C25展位参观交流,现场体验。

Continue Reading星宸科技登陆2026北京车展

张雪机车在香港卖爆单!冠军车型售价超8万港元 订单排到9月

快科技4月24日消息,据媒体报道,今年4月,张雪机车正式签约香港总代理。

据悉,旗下全新旗舰车型820RR以8.2万港元的价格开启预订,订金为2万港元。

在中国内地,820RR版起售价为43800元,在香港加上35%的首次登记税,但车迷同样抢着下定。

目前,该车首批配额已全部售罄,预计7月到港,第二批则预计于8月到港。

近日,张雪机车香港总代理商萧锦滔表示,他家店已经卖了100多部张雪机车,现在客人现在进门就是三句话:“有没有车?坐一下?几时可以拿车?”

萧锦滔透露,不少购入首批820RR的人都是为了爱国情怀,专门买车收藏。

他表示自己曾当过12年专业车手,还赞助过刘德华的《烈火战车》。

他其实并没有试驾过张雪机车,但他信心满满地表示:“我看它的配置,一定是高质量的,不用上赛道,一看就知道了。”

张雪机车在香港卖爆单!冠军车型售价超8万港元 订单排到9月

Continue Reading张雪机车在香港卖爆单!冠军车型售价超8万港元 订单排到9月

第三代比亚迪元 PLUS 亮相:A级纯电 SUV 进入更细分的年轻化竞争

过去几年,A 级纯电 SUV 是新能源市场里最典型的主流品类之一。

它不像高端车型那样承担品牌技术展示的任务,也不像微型车那样主要解决短途代步问题。对大多数年轻用户和年轻家庭来说,A 级纯电 SUV 往往是第一辆新能源车,也是日常通勤、周末出行、家庭使用之间的平衡选择。

因此,这个市场的竞争逻辑一直很现实:空间要够用,续航要安心,补能要高效,配置要有诚意,同时价格不能脱离主流消费区间。但随着纯电车型越来越多,单纯强调参数已经不太够了。用户不仅要一台好用的车,也希望它在设计、色彩、座舱氛围和使用细节上,能够更贴近日常生活。

4 月 24 日,北京国际车展上,第三代元 PLUS 正式首发亮相。作为比亚迪首款全球战略乘用车,元 PLUS 此前已经积累了较大的市场基础。官方数据显示,元 PLUS 全球累计销量已经突破 110 万辆。对于这款车来说,第三代产品的任务并不只是常规换代,更是在原有规模优势之上,继续回应年轻用户对纯电 SUV 的新需求。

从产品信息来看,第三代元 PLUS 的变化首先体现在车身尺寸上。新车长宽高为 4665×1895×1675mm,轴距达到 2770mm,相比此前车型进一步放大。对于一台 A 级纯电 SUV 来说,尺寸提升直接关系到乘坐空间和储物能力,也会影响它在家庭使用场景中的适应性。

不过,第三代元 PLUS 并没有把设计重点放在单纯的「大」上。新车通过流畅腰线、同色轮眉、贯穿式侧裙、刀锋 D 柱和悬浮车顶等设计,尽量削弱大尺寸带来的厚重感。尾部采用环抱式形面和全新能量回路尾灯,并提供 18 英寸光环轮毂和 19 英寸箭羽轮毂两种选择。整体来看,它依然希望维持元 PLUS 过去偏年轻、轻快的视觉取向。

颜色也是第三代元 PLUS 这次比较明确的年轻化表达。新车带来了 6 款全新车色,包括幻梦粉双色、潮玩蓝双色、气场绿双色,以及线条灰、境遇青、空境白三款单色。相比传统家用 SUV 常见的黑白灰银,这套配色明显更强调个性和情绪表达。

这种变化背后,其实是年轻用户买车逻辑的变化。车不再只是一个交通工具,也会在一定程度上成为个人审美和生活方式的一部分。尤其是在 15 万级纯电 SUV 市场,车辆既要足够实用,也要避免过于工具化。第三代元 PLUS 把色彩和造型作为重点,正是为了回应这一层需求。

座舱部分,第三代元 PLUS 提出了「流体生态舱」的概念。新车内饰以圆润线条、流畅曲面和自然生态为设计核心,中控台采用层叠悬浮式立体曲面设计,并配备全新两幅式多功能方向盘和集成式电子怀挡。相比外观,座舱的重点不只是视觉新鲜感,也包括日常使用的便利性。

例如,新车设计了 39 处储物空间,覆盖手机、钥匙、眼镜、充电线、水杯等高频物品的收纳需求。对家庭用户和年轻用户来说,车内储物往往是高频但容易被忽略的体验点。一个顺手的储物格,有时候比一项不常用的配置更能影响日常好感。

此外,第三代元 PLUS 还设计了「手办妙妙屋」,可以用来摆放手办、潮玩、立牌等物品。这一设计看起来并不传统,但它对应的是年轻用户更个性化的车内空间表达。智能座舱和大屏系统之外,用户也希望车内有一些属于自己的小空间,这种细节会让车辆更像生活场景,而不只是出行工具。

在核心使用能力上,第三代元 PLUS 也进行了升级。根据官方信息,新车将提供 630km 续航,并支持闪充能力。对于主流纯电 SUV 用户来说,续航和补能依旧是影响购买决策的重要因素。尤其是在家庭用车场景里,用户需要的不只是城市通勤够用,也包括跨城出行、周末短途和临时补能时的确定性。

配置方面,新车还提供云辇-C、远端气囊、TBC 高速爆胎稳行系统、电动前备箱、迪声 16 扬声器音响系统、女王副驾等配置。从这些信息看,第三代元 PLUS 希望在 15 万级 A级 SUV 市场里,继续通过较完整的配置组合提升产品价值感。

第三代元 PLUS 还与全球知名 IP 小马宝莉展开合作,并在车展现场展出了以「紫悦」形象打造的「元气痛车」。这种跨界合作和产品本身的年轻化定位比较一致。对于车企而言,IP 联名并不能替代产品力,但它可以强化车型的情绪标签,也更容易在车展和社交平台形成传播记忆点。

在今天的 A 级纯电 SUV 市场,竞争已经不只是「有没有电」「续航多少公里」这么简单。对用户来说,一辆车既要解决现实问题,也要在审美和情绪上提供一点额外满足。第三代元 PLUS 试图做的,就是在主流家用和年轻表达之间找到平衡。

新车预计将在今年上半年上市。最终它能否延续元 PLUS 此前的市场表现,还要看上市价格、具体配置分布,以及同级竞争车型的变化。但至少从北京车展首发信息来看,第三代元 PLUS 已经把自己的方向表达得比较明确:它仍然是一台面向主流市场的纯电 SUV,但不希望只以「实用」来定义自己。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Continue Reading第三代比亚迪元 PLUS 亮相:A级纯电 SUV 进入更细分的年轻化竞争

扒完 DeepSeek V4 报告,我翻出了这个隐藏彩蛋

今天上午,DeepSeek V4 发布,直接把这个大模型疯狂更新月推向了最高潮。

百万上下文标配,性能比肩顶级闭源模型,首发适配华为昇腾芯片,随便一个点单拎出来能写一篇爆款头条。

不过在我翻看 V4 的技术报告的时候,在训练层面看到了一个被大部分人滑过去的名词:Muon 优化器

这个技术名词,怎么看着这么眼熟呢?

原来是前两天发布的 Kimi 2.6 里,就是通过 Muon优化器,在相同的训练量下实现了2倍的效率提升,并在 1 万亿参数规模上解决了训练不稳定的难题。

早在上个月杨植麟站在英伟达 GTC 2026 的舞台上,花了演讲中最长的一个板块讲它。Kimi 是全世界第一个发论文证明 Muon 可以用在万亿参数大模型训练上的团队。
(附APPSO解读文章链接)

杨植麟是这样说的:「用 MuonClip 而非 Adam 训练 Transformer 大模型,效果会好得多。」正确实现后,token 效率提升 2 倍。在数据墙面前,这相当于把 50 万亿 token 用出了 100 万亿的效果。

现在,这项技术出现在了 DeepSeek V4 的训练方案里。

我又回来翻了一下 Kimi K2 的架构底层,又发现了一个更有意思的细节:它用的是 DeepSeek-V3 提出的 MLA(Multi-head Latent Attention)。

DeepSeek 的技术报告写着 Kimi 的名字,Kimi 的架构底座写着 DeepSeek 的名字。 你中有我,我中有你。

这大概是中国 AI 圈最魔幻的一幕:两家被外界反复对比的开源双子星,技术底层早就长到了一起。

而且,Kimi 类似这样的巧合,已经不是第一次了。

五次「撞车」,五个拐点

算上 V4 和 K2.6 前后脚上线,这已经是 Kimi 和 DeepSeek 过去一年里的第五次「撞车」了。

▲ 图片由 image-2 制作.

五次「撞车」,如果只是时间重合,那叫巧合。但把每次发布的内容拉出来看,你会发现一条清晰的暗线:每次撞车恰好对应一个 AI 行业拐点的到来

第一次是最戏剧性的。2025 年 1 月 20 日晚 8 点 10 分,DeepSeek R1 发布并以 MIT 协议完全开源。不到两小时后,Kimi k1.5 亮相。

两者都瞄准同一件事:让模型从「张嘴就来」变成「先想后说」,用强化学习跑通 Long-CoT 长思维链推理。

在这之后,中国的开源力量就彻底改变了整个全球 AI 的格局。

后来 OpenAI 在一篇论文中点名指出:Kimi 和 DeepSeek 是「最早复现 OpenAI-o1 Long-CoT」的两家公司。全世界只有这两家中国公司看懂了 OpenAI 在做什么,并且用自己的方式做了出来

那是中国 AI 从「追随者」开始变成「引领者」的分水岭。

最近这次就是今天。四天之内,K2.6 带来了 SWE-Bench Pro 58.6% 的 Agent 集群并行编程能力,V4 把百万上下文做成了所有服务的标配,输出长度拉到 384K tokens。

两家同时推进国产芯片适配:V4 下半年支持华为昇腾 950,寒武纪已完成 Day 0 适配;K2.6 支持国产芯片混合推理。

Agent 能力、编程天花板、百万上下文、国产芯片适配、开源生态,全齐了。

从「学会思考」到「学会干活」,从「改 Transformer」到「改算力底座」,五次撞车其实展现出来的,是中国 AI 不再一味对标 OpenAI ,逐渐不再依赖英伟达,在开源上走出属于自己的路。

撞车背后的必然

发布撞车的巧合固然有意思,但更值得关注的,其实是巧合背后的一些必然。

让我们先回到 DeepSeek 架构里的 Muon 。

杨植麟在 GTC 演讲中讲了一个技术困难:当 Kimi 把 Muon 扩展到 1 万亿参数时,训练不稳定性成了拦路虎。最大 logits 爆炸超过 1000,正常值只有 50 到 100。

损失先降后炸,根本无法收敛。他们的解法是 QK-Clip,对每个注意力头计算最大 logit 的裁剪值,把查询和键限制在合理范围内。训练损失不受影响,但稳定性问题消失了。

K2 模型用这套技术完成了训练,创下机器学习史上最大规模 Muon 训练的纪录。

而 DeepSeek V4 的技术报告里,Muon 被直接写进了训练方案。大多数模块用 Muon 加速收敛,嵌入层和预测头仍用 AdamW,混合使用。这是对 Kimi 底层创新的一次直接引用。

反过来,Kimi K2 的底层架构采用了 DeepSeek-V3 提出的 MLA。Multi-head Latent Attention,通过压缩 KV 缓存大幅降低推理成本,是 V3 最核心的架构创新之一。

你的论文成了我的基础设施,我的创新成了你的底座。 写在引用列表里的互相成就。

在硅谷,你很难看到这种事。OpenAI 和 Anthropic 之间的技术是「护城河」,能藏则藏。但 Kimi 和 DeepSeek 之间长出了一种更原始也更健康的关系:开源社区里的正向循环

Kimi 和 DeepSeek 是中国首批开源万亿参数模型的玩家,都相信 Scaling Law。技术路线上,DeepSeek 以推理模型见长,Kimi 以 Agent 能力著称。

底层架构上,两家都在挑战同一批「古老」的基础设施。Kimi 发了「注意力残差」论文,DeepSeek 做了 mHC 残差连接,都在改 ResNet 时代留下来的残差连接方式。

在长文本这条线,Kimi 探索线性注意力(Kimi Linear),DeepSeek 探索稀疏注意力(DSA),殊途同归。

所以当它们撞车时,与其说是巧合,不如说是对同一个方向的必然趋同。

用中国的芯片,跑中国的模型,对全世界开源

在 OpenRouter 上,Kimi 和 DeepSeek 稳居中国模型调用量前两名。

Cursor 接入了 Kimi,日本乐天 Rakuten AI 3.0 基于 DeepSeek 开发。被海外产品「套壳」这件事,放在两年前是耻辱,现在是勋章。

Meta 新模型 Muse Spark 发布时,官方 Blog 做的对比基准线里,Kimi 和 DeepSeek 跟 GPT-4、Claude 并排站着。英伟达 GTC 上,黄仁勋用来展示芯片性能的中国模型就是这两家。

海外认可之外,更值得注意的是国产芯片这条线。H20 芯片已断供一年,高端推理芯片短期内只有国产一个选项。两家公司同时在做同一件事:让中国模型跑在中国芯片上。

上周黄仁勋在播客访谈里说了一句话:「如果当初 DeepSeek 先在华为平台上发布,那对我们来说非常可怕。

今天,V4真的首发适配华为昇腾,工程团队把整个技术栈从 CUDA 迁移到了华为 CANN 框架,从算子库到通信原语到内存管理,V4 的混合注意力、MoE 专家并行、FP4 量化训练,几乎每层从头实现。寒武纪也在 Day 0 完成了 V4 全系列的 vLLM 推理适配,代码已开源。

黄仁勋一语成谶。

而 Kimi 在国产芯片上走的路更早,也更深。为了给国产芯片「铺路」,Kimi 在架构创新上掏出了两个杀手锏。

Kimi Linear 混合注意力架构把线性注意力层与全注意力层以 7:1 配比混合,将 KV 缓存体积压缩到极低水平。实测数据很直观:32K 上下文下,混合架构模型 KV 吞吐量仅 4.66 Gbps,同规模稠密模型高达 59.93 Gbps。

KV 缓存传输需求被压到了普通以太网可承载的范围,RDMA 高速网络从「必选项」变成了「可选项」。

在此基础上,Kimi 联合清华大学发布了 PrFaaS(预填充即服务)论文,把推理的 Prefill 阶段和 Decode 阶段彻底解耦,调度到不同异构硬件集群上。实测吞吐量提升 54%,首词延迟降低 64%。

这套方案打破了「大模型推理必须绑定同一种高端 GPU」的前提:算力强的国产卡做 Prefill,带宽强的国产卡做 Decode,各司其职。

DeepSeek 用 V4 证明了国产芯片能跑万亿参数的旗舰模型,Kimi 用架构创新证明了国产芯片可以跑得好、跑得省。

一个从工程适配切入,一个从架构设计切入,终点都是同一个:让英伟达不再是唯一选项

以前的国产 AI 叙事是「用英伟达的卡,追 OpenAI 的模型」。现在这对双子星同时在写另一个剧本:用中国的芯片,跑中国的模型,服务全世界的开发者

你的 MLA 是我的基础,我的 Muon 是你的加速器

回看这一周AI 行业的疯狂更新,我们已经处在了一个新的转折点。

同一周内,两个中国团队各自发布了万亿参数级开源模型,性能逼近甚至持平美国顶级闭源模型。这在一年前是不可想象的。

当闭源模型的价格是开源模型的 50 倍,开源阵营每隔几个月就推出一个新的万亿参数选手,竞争天平正在发生微妙的倾斜。

这不是「赢了」或「超越」这么简单的胜负之分。闭源模型在复杂推理和系统可靠性上仍然有明显优势,Opus 4.6 的思考模式依然是 V4-Pro 追赶的目标。但开源阵营的速度、成本优势和生态覆盖面,正在改变这场竞赛的规则本身。

除了这五次撞车发布,这两家公司还有一个巧合。梁文锋来自广东湛江,杨植麟来自广东汕头。两个广东人,撑起全球开源 AI 半边天

梁文锋像工程师哲学家,相信开源和底层创新,V4 发布公告结尾引的是荀子,「不诱于誉,不恐于诽,率道而行,端然正己。」

至于杨植麟在我看来像产品科学家,他认为用户体验和技术突破可以兼得,在 K2.6 发布时他提到了 Linux 之父 Linus Torvalds 那句「Talk is cheap. Show me the code.」

一个古典,一个极客。就是这两个风格迥异的创始人,一起定位了中国开源模型在世界坐标系的位置。

你的 MLA 是我的基础,我的 Muon 是你的加速器。这大概也是中国在能在短时间内引领全球开源 AI 的重要原因之一

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Continue Reading扒完 DeepSeek V4 报告,我翻出了这个隐藏彩蛋