“忽悠式”回购“翻车”,广汇能源与“新疆首富”仍在困局之中

图片系AI生成

5月18日晚间,广汇物流(600603.SH)因回购“放鸽子”被证监局责令整改:公司公告,因公司股票回购方案未能如约完成,公司收到四川证监局下发的《行政监管措施决定书》。

兜兜转转近两年的回购大戏,被广汇物流拖延为“忽悠式回购”的典例。期间,广汇物流财务造假东窗事发被罚戴帽,广汇系亦连环暴雷,巨债压顶。加上煤炭市场持续走弱,国铁运价下浮,公司被迫跟降,陷入“量增价减”错配,能源物流板块营收与毛利率双双承压,业绩三年连降。

屋漏偏逢连夜雨,最终回购下限只完成一半,利润腰斩再腰斩。投资者的信任、公司的信誉、新疆首富的面子与里子,眼下可谓是摇摇欲坠。

重磅回购变空头支票

此前,广汇物流于2024年7月16日披露回购方案,拟以集中竞价方式回购股份用于注销,金额为2亿至4亿元,期限为股东大会通过后12个月;2025年7月3日公告将实施期限延长9个月至2026年4月30日,并于7月18日经股东大会审议通过。

彼时广汇物流股价已经自2022年9月的12.8元高点一路波动下跌,“膝盖斩”至4元附近,公司意在回购注销给市场打一针强心剂。

这种下跌与业绩走势的极度背离,真实原因是广汇物流当时虚增了超过一半的财务数据:2022年度虚增营业收入28.94亿元,占当期披露营业收入的57.65%,虚增营业成本20.13亿元,虚增利润总额6.22亿元,占当期披露利润总额的78.52%。

图源:公司公告

于是,回购期间的四个插曲,备受市场关注。

其一是首度披露回购后两个月,“9.24”节点来临,广汇物流股价迅速翻了两番,超出了原回购方案规定的回购价格上限。

其二,上述财务造假案东窗事发,2024年9月广汇物流被罚500万元,并同步戴帽。

其三,“广汇系”连环“暴雷”,在巨额资金压力下2024年8月广汇汽车退市,“广汇系”丢掉半壁江山;2025年,广汇能源业绩大幅不及预期;2026年1月,广汇能源又需补缴税款及水土保持费合计超13亿元,雪上加霜。

其四,回购发起之初,公司宣称“当前经营状况及发展态势良好”,意在回购注销。而今风云突变,业绩连跌三年,“广汇系”多个板块全线承压。

截至2026年4月30日到期日,广汇物流实际回购金额仅1.0048亿元,未达承诺下限,偏离率达49.76%。

上交所指出,该行为违反《股票上市规则(2026年4月修订)》第1.4条及《上市公司自律监管指引第7号——回购股份》第五条、第三十一条等规定;时任董事长郭舰、刘栋未勤勉尽责,违反相关信披与履职义务。

据此上交所对广汇物流及郭舰、刘栋予以监管警示,并要求公司在1个月内提交由全体董事及高管签字确认的整改报告,全面排查信披与规范运作隐患,切实提升治理水平。

利润腰斩再腰斩,新疆首富也扛不住了?

回购代表的“股价被严重低估”、“业绩有大幅改善空间”意味,与现实已经背道而驰,除了Q1业绩断崖,不断“卖卖卖”的孙广信,如今也已很难保住“新疆首富”的位置。

回购实施期内,广汇物流营收和利润双双出现高双位数下滑,扣非利润降幅接近四成,核心经营能力的下行趋势已经相当明显:

2026年一季度,广汇物流利润几近“腰斩再腰斩”,营业收入5.63亿元,同比下降 22.87%;归母净利润1471万元,同比大降92.90%;经营活动产生的现金流量净额:3.94亿元,同比下降 16.07%,快速跌入勉强维持的微利局面。

在2025年度暨2026年一季度业绩说明会上,公司给出的解释主要集中在能源物流板块的外部环境:自2025年二季度以来,国内煤炭市场持续走弱,供需宽松,煤价下行;国铁集团执行运价下浮优惠政策,为保持区域竞争力和发运规模,公司同步下调运价;出现典型的“量增价减”错配:运量虽然增加,但单价下滑更快,新增收入难以覆盖价格降幅导致的缺口,能源物流板块整体营收和毛利率承压。

公司同时强调,从环比数据看,煤炭及运价已有企稳迹象,单季度盈利能力“稳中有增”,未来将通过审慎制定价格政策、拓展新市场、优化客户结构等方式提升抗风险能力。

但对二级市场而言,回购承诺严重缩水、业绩连续大幅下滑的公司,转好预期是难以仅凭几句展望就达到的:自3月以来,广汇物流股价已下跌超31%,4月24日年报发布次日,公司股价跌停,“摘帽”以来,广汇物流整体表现延续弱势。

从集团视角看,近年来广汇能源盈利承压,广汇宝信市值大幅缩水,广汇汽车板块爆出百亿债务压力、经营网点大幅收缩等问题,加上广汇物流的财务造假处罚、广汇汽车的退市等事件,更直接击穿了市场对广汇系“资金实力+千亿资源整合”题材的信任。这种背景下,广汇物流的“忽悠式”回购代表了广汇系的信誉折价,已经再度逼近底线。(文 | 公司观察,作者 | 黄田 ,编辑 | 曹晟源)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading“忽悠式”回购“翻车”,广汇能源与“新疆首富”仍在困局之中

一季度AI广告收入暴涨170%,B站:模型没有,广告管够

图片由AI生成

在DAU 1.15亿、MAU3.76亿的基础上,B站的用户日均使用时长达到了119分钟的历史新高,这意味着它依旧是全网年轻人“杀时间”和情绪粘性强的社区。

5月19日发布的一季度业绩报告中,B站“AI智能体”、“AI创业”等关键词搜索量同比增长超500%,OpenClaw相关稿件播放量接近9000万,带动了一批前沿技术分享、实用安装教程、产品应用实践等爆款稿件。

AI应用的发展,也让越来越多的厂商选择在B站建立品牌影响力,带动本季度AI广告收入同比增长170%。本季度,B站广告收入为25.9亿元,同比增长30%,连续13个季度保持同比高速增长。

也就是说,AI应用大卷之年,B站已经先赚到了一波。

不过,按营收来源看,B站的传统优势板块在进一步下滑。尽管《FGO》《碧蓝航线》等老自研和独代游戏保持稳健,《三国:谋定天下》在海外表现尚可,但受制于去年同期的高基数效应,以及新爆款尚未能完全接力的空窗期,这个B站曾经的现金牛如今在总收入中占比已滑落至20%,本季度收入同步下降12%。

此外,B站的增值服务收入为29.1亿元,同比仅增4%。在直播行业大环境变化以及用户对用户对娱乐支出谨慎的背景之下,该板块很难再提供爆发性增长。而被娱乐产业视为下一个爆发增长趋势的IP衍生产品相关的业务,同比还下降了4%。

B站的”破圈”叙事似乎已经逼近极限。一季度,B站的MAU同比仅增长2.2%,DAU同比增长8%。这说明B站的“破圈”红利见顶,未来将进入基本存量时代。B站难以再靠目前“新用户”去讲故事,未来商业化上,只能最大限度压榨单个用户价值(ARPU)。

广告目前是B站增长的绝对大头,这也必意味着站内广告加载率(Ad Load)的会进一步提升,内容信息流中商业化痕迹也可能加重。而B站引以为傲的“119分钟超长时长”和“80%正式会员留存率”,极度依赖干净和优质的社区生态。当美奢、汽车、电商等商业化内容大举进攻时,如何不引发核心二次元和硬核技术用户的逆反心理,将最终考验高管层的平衡掌握。

目前来看,B站的新故事的接力棒来到了AI内容上。财报和业绩会中,大篇幅提及了AI相关的内容,B站俨然成为了AI的“流量的宣发阵地”和“教程分发中心”, 由此赚到了170%增长的AI广告费。

不过,B站本身并长出属于自己的大模型或强墙垒AI应用,目前也没有消息显示B站如小红书那样以高调调整组织架构,提级AI部门权重,以应对AI大浪潮。

但它独特社区的生态,AI内容的观看时长环比增长达44%。在全站用户时长已经高达119分钟的存量天花板下,AI品类依然能够啃下这么大的环比增量,说明它正在疯狂吸纳站内用户的注意力。

今年是AI应用包括AI Agent大批量落地的年份,厂商们忧心忡忡,迫切需要找到高ROI、懂技术的年轻用户。而B站,按其官方的自我认定来看——“技术教程最成熟、实践内容最丰富的AI内容社区”,自然成为了顶尖AI厂商建立品牌影响力并获取种子用户的第一宣发阵地 。

财报同时还提到,B站用户对虚拟偶像的偏好,直接带动AI音乐观看时长同比增长40%,AI生图、AI生成音乐等技术的演进,降低了虚拟偶像的“二创”的壁垒,让这一二次元传统强势品类在AI时代找到了效率红利。

但需要看到的是,AI在广告和流量上收获颇丰,但在B站占据大头的核心支撑业务中,AI的赋能效果仍未显现出来。全网都在谈论AI带动游戏NPC新玩法,AI降低游戏美术成本,AI并未能在短期内转化为游戏业务的收入提振。B站的游戏在吃老本,或者说,依赖传统宣发,缺乏“AI游戏”的破局点。

而AI音乐和虚拟偶像观看量大涨40%,但这种内容热度并没有成功转化为高毛利大会员付费或直播打赏收入,说明AI内容目前是“看热闹”的心态居多,粉丝更愿意为真人UP主充电(充电月均付费用户数量同比增长40%),对纯AI生成内容或低互动AI主播的付费意愿依然模糊。

B站的核心竞争力在UP主(视频/直播创作者),但AI势必会消解真人创作的护城河。B站正在大力推崇AI内容和AI工具,但随着AI创作的门槛越来越低,站内是否会充斥大量的AI洗稿和AI搬运内容?如果这类内容抢走了真人UP主的流量,导致那些“为爱发电”的硬核创作者收入减少,是否会动摇B站“以优质创作者为基础”的立身之本?

在全网都在为大模型烧钱、变现困难而痛苦时,B站凭借“AI应用试验场”和“AI淘金热的卖水人”定位,通过170%的AI广告增长抢先实现了商业化落袋,但在游戏和社区生态的长期建设上,AI这把双刃剑才刚刚开始挥动。(本文首发于钛媒体APP,作者|李程程,编辑|杨林)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading一季度AI广告收入暴涨170%,B站:模型没有,广告管够

广州酒家拟发10亿可转债再启扩张,增收不增利困局待解

5月18日晚,中华老字号广州酒家(603043.SH)披露上市以来首次再融资计划,拟发行可转债募资不超过10亿元,投向四大核心项目。

这是广州酒家正式启动第二次大规模扩张,距离2017年IPO募资6.15亿元已过去近9年。本次募资中,食品制造基地产能扩充及技术改造项目(4.72亿元)与省外市场拓展及食品零售网络建设项目(2.9亿元)合计占比76%,清晰展现了“扩产能、拓市场”的双线战略。

然而,在公司毛利率持续下滑、净利润增长乏力、股价承压的背景下,这笔相当于当前市值约12%的募资,既是一次破局尝试,也暗含“豪赌”意味。

“双核驱动”谋全国化布局

根据公告,广州酒家本次拟发行可转债募集资金不超过10亿元,扣除发行费用后,将主要投向四个核心项目。这四个项目的总投资额高达12.93亿元,其中,“食品制造基地产能扩充及技术改造项目”与“省外市场拓展及食品零售网络建设项目”无疑是本次募资的绝对主角,两者合计占用资金约7.6亿元。

具体来看,“食品制造基地产能扩充及技术改造项目”计划总投资6.16亿元,拟使用募投资金4.72亿元。该项目将对广州酒家起家的番禺基地进行大刀阔斧的升级改造。番禺基地作为公司的大本营,占地面积约10万平方米,承载着月饼、速冻点心、广式腊味等八大系列产品。

此次改造不仅将新建4号厂房,还将对原有厂房的仓储和物流动线进行重新设计。在4年的建设期内,广州酒家希望通过提升自动化水平与空间利用率,为未来的市场需求爆发做好产能储备。

公司方面对产能消化显得颇有信心,强调其手握“广州酒家”“陶陶居”“利口福”等中华老字号品牌,并通过在沪杭苏等地举办快闪活动及构建新媒体矩阵,不断将广府饮食文化转化为品牌溢价。

省外市场拓展及食品零售网络建设项目拟使用募资2.9亿元,是本次扩张的另一核心抓手。该项目总投资4.39亿元,拟使用募资2.9亿元。

广州酒家显然不甘心局限于华南市场。项目规划在华东、华北、华中、西南等重点区域设立21个销售部,组建本土化销售铁军,以此实现对省外市场的精耕细作。

同时,公司还计划在华南地区以直营模式开设70家“多乐颂”和“利口福”烘焙门店,进一步加密线下零售网络。数据显示,公司广东省外市场收入仅为省内的约三分之一,这片广阔的蓝海无疑是其急于补足的短板。

除了硬实力的扩张,剩下的2.38亿元募投资金将流向软实力建设。其中,1.25亿元用于集团数字化转型,旨在打通“餐饮+食品”双主业的数据壁垒,升级智能供应链;另有1.13亿元投向新一代健康食品关键技术研发,涵盖食药同源、全莲产业链及抗冻融面团等前沿课题,试图在健康化趋势中建立技术护城河。

客观而言,这份募投计划逻辑自洽,直击广州酒家的发展痛点。但对于一个当前市值徘徊在80亿左右的上市公司而言,一次性抛出10亿元的融资计划,资金压力与摊薄效应不容小觑。这步险棋能否走通,不仅考验着管理层的执行力,更取决于其能否在激烈的市场搏杀中兑现业绩。

增收不增利隐忧显现

这份10亿元的可转债预案,某种程度上是广州酒家迫在眉睫的突围之战。回顾其资本之路,这已是这家老字号的“第二次大规模扩张”。

上一次的扩张高潮要追溯到2017年公司登陆A股市场之际。当时,广州酒家通过IPO募集了6.15亿元净额,确立了扩产与渠道建设的基调。

随后,公司将部分资金变更投向了湘潭和梅州两大生产基地,这两个基地历经数年建设,终于在2022年左右相继投产。与此同时,公司在2019年斥资约2亿元并购了同属老字号的“陶陶居”,完成了品牌矩阵的强势补位。

从成绩单来看,前一轮资本运作确实带来了规模的跃升。公司营收从2019年的30.29亿元一路飙升至2025年的53.81亿元。然而,亮眼的营收曲线背后,公司的净利润并未同步跟上。2019年净利润为3.84亿元,虽然在2022年达到5.58亿元的历史峰值,但此后便陷入了停滞不前的窘境。

广州酒家增收不增利的核心原因在于毛利率的持续下滑。数据显示,2021-2025年期间,公司的毛利率分别为37.83%、35.63%、35.62%、31.72%、31.60%,呈现逐年下降趋势。2026年一季度,毛利率进一步降低至28.11%,创近年来新低。

在财务数据不佳的影响下,广州酒家的股价也持续承压。今年以来,公司股价累计下跌了17.87%,截至5月19日收盘,公司股价报14.48元/股,市值82.36亿元。此次公司计划募资约10亿元,相当于当前市值的约12%,募资规模较大引发市场担忧。

投资者担心的是,在毛利率持续下滑、净利润增长乏力的背景下,短期内难以带来明显的业绩提升。更重要的是,公司能否有效利用这笔资金,改善收入结构,提升盈利能力,打破当前的增长瓶颈,仍存在较大不确定性。(文 | 公司观察,作者 | 周健 ,编辑 | 曹晟源)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading广州酒家拟发10亿可转债再启扩张,增收不增利困局待解

特朗普再次访华!6本书看懂中美会谈的关键

(本文作者为 活动精选,钛媒体经授权发布)

文 | 时代华语图书

特朗普首次访华时,中美曾签下2535亿美元大单。这次访华,对中美双方都意义重大,双方可能谈到哪些议题?未来中美走向如何?对中美双方乃至世界的政治经济走向会产生哪些影响?从这6本书中,可以预瞻一些端倪。

一、读懂美国与特朗普

《见证:白宫深处的权力游戏》

关键词:王冰汝、驻美记者、白宫权力、特朗普、美国政坛

一句话简介:驻美十余年,经历四届美国总统,这本书告诉你,白宫这座“纸牌屋”的真实运行规则。

王冰汝 著

想要看懂中美谈判桌上的压力和变数,首先要看懂美国自己。王冰汝是白宫记者协会(WHCA)中唯一的中国记者,她的这本《见证:白宫深处的权力游戏》,堪称当代美国政治的精缩注解书。

特朗普从第一任期到“被抄家”,从遇刺到重返白宫;拜登如何在大选乱局中仓促上阵又黯然退选,再到特朗普如何在争议中重回聚光灯下——这些近乎魔幻的历史事件,王冰汝都凭借白宫记者的专属席位一一记录在案书中,不光有美国大选时的邮寄选票争议与国会山暴乱,还深度追问了从克林顿、小布什到特朗普和拜登这一众美国总统的施政姿态。

对于如今特朗普的种种表现,王冰汝在书里用大量一线白宫新闻发布会的“私人笔记”给出了答案:这位商界出身的总统把外交与经济谈判都视作一笔笔可交易的有形资产,而白宫深处的权力游戏永远不会落幕。

二、看懂关税冲突

《乡下人的悲歌》

关键词:美国底层、万斯、迎合选民、铁锈地带、白人工人阶级

一句推荐:中美谈判桌前谈的每一个百分点关税,背后都有着万斯这样的美国“乡下人”在推动。

J.D. 万斯 著      刘晓同 庄逸抒 译

特朗普2016年意外胜选时,全球精英阶层极度困惑,为什么一位毫无治国经验的地产大亨能击败老牌政客希拉里?美国学术界和媒体普遍认为,从那一年开始,这本占据各大畅销榜首的《乡下人的悲歌》就是解开“特朗普现象”的最优密码。

本书的作者如今已经是美国副总统。书里以万斯在俄亥俄州工薪小镇的成长经历为脉络,细腻描绘了那些被全球化和产业外移抛弃的白人蓝领阶层:他们的小镇近乎三分之一的人生活在贫困线以下,药物成瘾成风,孩子们从小看不到未来,巨大的无力感最终化为对体制的绝望。

正是这份愤怒与绝望,让万斯所代表的草根阶层一夜倒向高举“让美国再次伟大”大旗的特朗普。特朗普的关税政策表面号称“保护美国制造”,其实是在向这群再也输不起的底层释放最简单的政治信号——哪怕只是一句口号、一个象征,就足以赢得不计代价的回报。

读懂了万斯笔下的“铁锈地带”悲歌,谈判桌上强硬到不讲道理的关税壁垒,就从抽象的数字还原为了美国社会难以弥合的苦痛根源。

三、经贸博弈

《中国力量:迈向世界之巅的九大战略支点》

关键词:中国制造、十五五规划、战略支点、世界工厂、中国崛起

一句推荐:硬刚美国的底气,是每一个“从世界工厂到世界引擎”的制造业奇迹支撑起来的。

江海 著

了解了美国之后,再回头看我们自己。江海在《中国力量:迈向世界之巅的九大战略支点》中给出的,是一份关于当今中国经济韧性与科技积累的详实答卷。

书中从制造业、基础设施、数字科技、新能源、航天、人工智能、金融、文化,以及人类命运共同体构建九个领域,全方位剖析了中国在新世纪全面崛起的核心密码。它并未罗列枯燥的政策口号,而是用叙事的笔触告诉你,中国是如何一点一滴弥合与世界顶尖工业国之间差距的:从昔日的代工世界工厂,到今天全球唯一拥有全部工业门类的制造业大国,再朝着人工智能与航天科技发起冲锋。

在中美贸易摩擦最白热化的阶段,不少唱衰论调不绝于耳,但《中国力量:迈向世界之巅的九大战略支点》冷静而理性地揭示了一个无可辩驳的事实:中国的“硬刚”,建立在最扎实的基础设施能力、前所未有的智造革命以及打通国内国际双循环的宏大格局上。它不是自吹自擂的政治宣言,更像是一幅完整的东方大棋图谱,让我们看清自己在高端技术领域与国际对手的真实差距和已有优势——清楚自己底牌的玩家,才有资格坐上决胜的牌桌。

四、科技与AI谈判

《马斯克科技帝国》

关键词:马斯克政治派、算力主权、AI军工复合体、科技右翼、特朗普白宫

一句推荐:读懂马斯克,你就同时读懂了美国未来30年的科技轨迹与白宫内部的最高技术权力。

朱翊璋 著

即便离开了白宫职位,马斯克对于美国政治的影响力仍在深入渗透。据美媒披露,马斯克与万斯每周通话数次,共享“科技民粹主义”理念,他的终极意图是以“财政节制、科技优先、放松监管”的理念重塑共和党,将其从一个传统政党转型为一个“科技右翼”政党。这种布局的目标不仅瞄准2026年中期选举,更指向2028年大选。

这本书推荐给每一位试图洞悉中美博弈“下一个终极变量”的读者:马斯克的科技帝国,不仅掌控着芯片、算力、能源、航天和AI的全链路闭环,还正在从技术底层直接介入华盛顿的权力逻辑。

《颠覆浪潮:跟马斯克一起畅游星辰大海》

关键词:马斯克、SpaceX上市、火星殖民、星链、特斯拉、自动驾驶、人形机器人、脑机接口、永生工程、丰裕时代

一句推荐:一本书读懂马斯克火星计划、星辰大海规划及人类文明下一百年路线图。

朱翊璋 著

当代国家所面对的所有结构性难题:劳动力不足、能源瓶颈、数据风险、经济增长放缓、人类寿命限制,在马斯克看来,本质上都是“操作系统限制”。如果文明要升级,就必须重写底层代码,但重写的方式不是开会、立法,而是造出新的基础设施,让社会在“技术强制迁移”的过程中自然进入新阶段。

因此,马斯克把整个文明当作一台巨型机器,他的工程是互为因果、相互补全的。无论是汽车、机器人、芯片,还是星舰、星链、Neuralink,所有工程最终指向一件事:确保人类文明持续存在,同时为每个个体提供前所未有的自由度、寿命和富裕度。

《芯片、战争和AI变局》

关键词:芯片战争、AI军工、硅谷五角大楼、AI变局

一句推荐:真正决定未来中美谈判筹码的,在硅谷和五角大楼的最新实验室里。

窦国庆 著

如果说前几本书主要从外部经济和社会环境阐述了中美博弈的缘起与过程,《芯片、战争与AI变局》则把读者拽进了决定国运最深底层的核心赛道——芯片与人工智能。

这本书的作者窦国庆是军事科学院与国防大学的战略学博士,学术分量极重。书中核心观点是:现代世界的军事、经济与地缘政治版图全部构建在微小硅芯片之上,曾经以钢铁和石油衡量的战争强度,如今正被高端制程的AI微芯片彻底改写。

《芯片、战争与AI变局》揭示了“硅谷”与“美军”联手组成“AI军工创新体”这一事实,并一针见血地指出:AI领域最终极的竞争将从企业利润问题演变为军事与国家安全的生存问题。美国频繁对一些国家采取军事行动,以及战争部宣布将领先AI公司先进技术重新部署于国防部机密网络,都标志着其战争思维从传统物理摧毁走向高精度、瞬时化、超算力战争的蜕变。

这对于中美谈判及未来有着极高的预警意义:当下一次谈判降临时,技术上的“安全枷锁”可能会比任何关税条款都更具破坏力。本书系统分析了AI时代硅谷科技资本对美国政治、经济、外交的全方位深度改造,也是我们预判美国下一步策略、开发自我防御体系的必读之书。

在“历史现场”层面。王冰汝的《见证》,是第一手的白宫战情观察实录,让你站在记者席上目击美国政治的每一次震荡;而万斯的《乡下人的悲歌》则是深入社会底层的调查报告,帮你打通从“为什么特朗普上台”到“为什么关税不断加码”的认知通路。

在“战略储备”层面。江海的《中国力量》是全国战略性产业的集大成照镜,帮助你确认我们的“武库”真实存量;窦国庆的《芯片、战争和AI变局》则是前瞻美军AI军工变革、研判下一轮竞争走向的最高层次材料;而《马斯克的科技帝国》是认知拼图的封底——打通了芯片、算力、能源、航天的全链路系统,并把它们捏合在对华盛顿的全方位政治渗透之中。读完它,你才明白中美竞争的下一个20年里,谁才是真正的“超级操盘手”。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading特朗普再次访华!6本书看懂中美会谈的关键

独家对话银河通用张直政:我们找到了VLA和世界模型的融合之路

“从加入银河到现在,除了吃饭睡觉,基本上都在工作。”说这话时,张直政抬手摸了摸鬓角,笑了笑,“多了一些白头发。”

5月的一个下午,在北京我们见到了银河通用机器人联合创始人兼大模型负责人张直政博士,他曾任微软研究院高级研究员,参与微软公司Copilot、Token Mixers、Dynamics 3让各式模型路线兼容并蓄,使不同具身数据各尽其用。65 Connected Spaces等多个大模型及相关产品研发,因其对人形机器人、具身智能等国家重要战略方向的突出贡献,2025年获评“北京市劳动模范”称号。

他说话风格犀利、直接,却又不失严谨,遇到模棱两可的问题时,喜欢先定义本质。这种习惯,大概源于长期坚守第一性原理训练出的思维方式。

“我在微软既做基模研究,也负责把基模变成大模型产品。”张直政回忆,“但越做越觉得,AI如果永远困在电脑里,这不是真正的AGI。把AI从数字世界释放到物理世界,让它在物理世界里感知、思考、行动、改变环境才是下一个阶段的挑战。”

2023年,恰逢王鹤刚创业,正在寻觅一个兼具研究背景和产品转化经验的人来主导大模型研发,通过中间人牵线,两人聊完一拍即合。

离开前,微软亚洲研究院院长问他:“加入一个刚成立的创业公司,明年的今天可能发不起工资,你真的想好了吗?”

“当一件事足够有意义,你又对它负主要责任时,就没有必要担心这件事情了。”张直政说。如今这家公司,已经成长为具身智能赛道的头部玩家。

这场对话,缘起于银河通用最新发布的技术LDA(Latent Dynamics Action Model)。这是一个在隐空间中统一世界模型与VLA的跨本体动作基础模型,首次在数据层面实现虚实共融、人机混合、质量参差、有无动作标签的数据统一有效利用。它真正做到了“让各式模型路线兼容并蓄,使不同具身数据各尽其用”。目前,该工作成果成功登顶今年仅有210篇录用的机器人顶会RSS,项目成果代码已全面开源。

对谈持续了一个多小时。从LDA的技术路线与落地挑战,到银河通用坚守初心的全栈思考;从具身行业的泡沫与“烧钱”真相,到那个万众期待的“具身GPT时刻”。

银河通用机器人联合创始人兼大模型负责人张直政博士

以下为与张直政博士的对话全文,略有删减:

智客ZhiKer:LDA(Latent Dynamics Action)是终局的唯一解吗?

张直政:目前看是最有希望的解。

智客ZhiKer:VLA与世界模型技术路线分歧的终局,您是怎么思考的?

张直政:现在行业里很多人把VLA和世界模型当成两条独立甚至对立的技术路线,但我们不这么看。

VLA模型直接学习策略,世界模型侧重预测环境的状态转移对环境状态进行建模,LDA既学习“我该做什么”,又建模“环境会怎么变”,在一个统一的Latent Space里让二者协同训练、相互增益。

后续行业可以将LDA当作具身智能大模型的底层框架,再结合不同类型、各具特点的数据一层一层地把它Scaleup起来。

智客ZhiKer:在理解世界如何演化这件事上,LDA与李飞飞和LeCun的世界模型相比有什么区别?

张直政:李飞飞和LeCun的世界模型主要在回答“世界应该如何被表征、预测和生成”。更关注对于物理世界在投影空间中状态建模的三个问题,生成一致的世界、多模态输入输出、以及在给定动作或目标时预测世界下一状态。而策略学习仅是其下游任务,他们仅做了简单初步的验证,尚未将其作为核心研究目标来攻克。

LDA更进一步把问题落到具身智能上,在回答“世界演化如何直接服务于动作生成,并且如何利用全谱系具身数据规模化训练”,更侧重“我能采取哪些行动”以及“应输出何种动作才能达成预期目标”,世界的变化只是其中的一个训练子任务。

智客ZhiKer:LDA理解固定场景下世界如何演化,不需要理解一个泛用场景下世界如何演化?

张直政:不能这么说。在LDA模型框架下,我们对世界状态的预测需要做得更准确、更泛化、更具效率。

相较于他们仅要求的“预测准确”,具身领域世界模型的要求是在任务所需的信息上实现精准预测的同时通过该预测辅助动作输出。

我举个例子,比如在网球运动上。很多世界模型是无差别地预测整个环境的变化;而LDA会在此基础上做进行具有选择性的信息处理,当下应该关注球的运动轨迹,还是对方运动员的位置,需要根据任务目标筛选出与策略相关的动作及环境状态变化,并利用其预测结果辅助策略输出。

总结而言,非具身世界模型仅聚焦于如何实现精准预测,而具身世界模型不仅要关注预测准确性,还要明确任务目标导向下输出动作需要有选择性地预测和处理何种信息,这正是我们多出来的要求。

智客ZhiKer:让模型同时理解“如何行动”和“世界如何演化”,这件事的难点在哪?

张直政:首先,模型对“如何行动”的理解属于策略学习范畴。其本质在于给定当前状态与任务目标,机器人应输出何种动作,才能让世界朝目标状态变化。

“世界如何演化”与这个问题紧密耦合,它关注的是在当前状态下(甚至可能不存在明确的任务目标),执行某个动作后未来会发生什么。

简单来说,前者对应“我能做什么”和“我应该做什么”的问题;而后者对应“环境会怎样变化”的问题,二者有不同的优化目标。

当这两个问题落到具身智能中时,就形成了深度耦合的关系。例如打网球,如果不建模环境变化、不预测球的轨迹,就无法接到球;但如果只建模环境变化,即便能接到球,也难以控制球,无法将球打向期望的落点。

由此可见,对于具身智能,这两个问题相互依存,既需要模型理解环境的变化规律,也需要明确通过何种动作能让环境产生期望的改变。

智客ZhiKer:四个任务在一个模型里如何协同?

张直政:我们需要设计一个统一的隐空间(Unified Latent Space),让这四个任务都能在该空间内被构建为统一的训练任务。这就是我们在LDA这个工作中提出的,将前向动力学(Forward Dynamics)、逆向动力学(Inverse Dynamics)、策略学习(Policy Learning)与视觉预测(Visual Prediction)这四个任务进行统一的核心思路。

我们需要从数据应用形式以及模型对数据训练的吞吐效率角度出发,采用统一的架构,对这四个任务进行统一建模和训练。在该联合训练(Joint Training)的范式下,通过大数据驱动的方式,让模型理解环境中哪些变化与动作相关,哪些变化与动作无关。

例如,其中有两个较为相似的任务:一个是前向动力学(Forward Dynamics),即给定当前状态与当前执行的动作(Action),预测下一个状态的变化;另一个是第四个任务,即直接根据当前状态预测下一个状态的变化。

通过这两个任务的共同学习,我们就能明确环境中哪些变化与动作相关,哪些变化与动作无关。正是通过这样的方式,促进这四个任务产生协同效应(Synergy)。

智客ZhiKer:四合一的结构下,预训练的算力成本会有什么样的变化?

张直政:四合一并不意味着算力成本直接乘以4。

四个优化目标被统一进一个模型训练框架中,在初期阶段,由于需要学习和优化的目标增多,学习要求增加,算力消耗确实会对应上升。但当模型的基础能力和基础知识积累到足够扎实的程度后,学习新知识的边际成本便会显著降低。

这正是我们坚持研发基模的核心逻辑,通过前期的更多投入,最终实现后期的更大规模技能的低成本、快速学习。

智客ZhiKer:在这套框架下,失败的数据是否更重要?

张直政:以打网球为例,人会知道,球飞过来的时候,如果用力挥拍,球就会出界。人为什么会知道这种结果?要么是看过别人这么做,要么是自己亲身试过。

这些认知是以知识的形式存在于人的大脑中,也应该存在于模型里,这就要求我们从失败中学习,而不只是依赖成功的数据。而光看视频,人无法精准把握动作的力度,因此具有难度的具身任务不仅需要对应失败的视频数据,还需要对应失败的动作数据。

本质上,要让具身模型具备泛化能力,必须让其理解在给定任务目标和状态下,做动作A会产生什么结果、做动作B会带来什么变化、做动作C又会导致什么情况,然后再决定采用哪种动作。

智客ZhiKer:需要采集多少失败数据?

张直政:这取决于任务难度和所采集的数据是否具有代表性。如果采集到的失败案例足够有代表性,就不需要采集太多;反之,采集再多也没有意义。

智客ZhiKer:怎么定义具有代表性?

张直政:代表性就是能不能代表某一类失败的情况。比如没接到球,拍子举得过高和举得过低是两种不同的情形,这两种情况都得包含在训练数据分布中。

智客ZhiKer:在实际训练效果中,低质量或含噪声的数据以及缺乏动作标注的视频数据处于怎样的定位?

张直政:我们的核心思路是利用高质量动作数据进行策略的针对性学习,同时借助低质量数据开展环境状态转移的建模学习。

智客ZhiKer:这个技术路线,是否降低了行业对数据采集与数据标注的需求?

张直政:肯定是这样的。

过去很大程度上依赖高质量的成功数据,而现在我们发现,当加入有噪声、无标注甚至低质量的数据后,对成功数据的需求量也随之大幅降低。

智客ZhiKer:训练模型的数据主要来自于哪里?

张直政:银河通用从Day One就在构建五层全量数据金字塔(AstraData),五层结构层层咬合。

最底下一层是互联网数据,直接从互联网上下载。第四层是无本体素材(人类行为数据),不依赖机器人本体,通过可穿戴设备采集真实数据。第三层是多本体仿真合成数据,通过仿真来造大量可泛化、可控分布的物理真实数据,这也是我们投入大力气建壁垒的维度。第二层是真实遥操数据,用来做后训练,跟场景需求对齐。最顶层是真机自主运行数据,这个是跟策略耦合的,模型耦合硬件部署到真实场景后,哪些干不好的地方,我们把它专门找出来。

无论行业外的技术范式在押注什么、投入什么,我们始终致力于将这座金字塔构建得愈发坚实,将每一层都打磨完善。

头部公司一个非常重要的能力,就是不为外界所动,想清楚需要什么,把它做实。

智客ZhiKer:LDA出来了后,对于具身的大规模商业化有什么意义?

张直政:缩短研发周期,降低商业化闭环的边际成本。

LDA具备少样本跨本体泛化能力,只需约1小时的后训练数据,就可以快速理解新硬件的运动学特性。这打破了以往机器人升级或改动硬件就需重新训练模型的困境。这种高效的适配能力,是模型从实验室走向零售门店、物流仓库等多元场景的基础。

我们已经把LDA的核心算法与代码体系全面开源,希望推动行业从封闭优化走向开放共建,这些通用数据处理和跨领域学习能力赋能行业的同时,会进一步反哺银河通用的全身全手通用基础模型银河星脑(AstraBrain)的基座能力提升。

具身智能要真正落地,早期必须有一家公司站出来,实现软硬件一体化布局,从头到尾打通全流程闭环。只有亲历并解决所有关键问题,才能将核心环节标准化、沉淀为工具,并开放给行业使用,最终推动整个产业向前发展。

如果没有这样一家公司,这个行业的发展将会十分缓慢。

智客ZhiKer:进工厂和家庭,你们内部的优先顺序是什么?

张直政:先进工厂,成为“生产力”;再进家庭,提供“服务力”。

智客ZhiKer:具身智能迎来GPT时刻的信号是什么?

张直政:我认为GPT时刻到来的依据有两点。

第一,能够将异构数据统一到模型训练中,并让它们产生协同效应,互为助力。

第二,当学习一个新的泛化维度时,无论是新硬件,还是新任务,所需的新数据量可以极大降低,甚至不再需要新数据。

智客ZhiKer:2026年至今,具身行业整体融资金额已超300亿元,您认为当前具身行业存在泡沫吗?

张直政:我个人认为,无法实现的目标才叫泡沫,能够实现的目标就不是泡沫,而是行业发展的动力。

如果给泡沫下个定义,它指的是行业期望达成的目标与当前技术水平之间的差距,这个差距也和时间相关。

举个例子,如果有人告诉你,今天他家的机器人还无法完成你想要的各类任务,但几个月后就能做到,你会觉得这是泡沫吗?显然不是。

可如果有人说,今天他家的机器人无法完成你想要的上门任务,但100年后或许可以,这一定是泡沫了。

事实上,所有行业都存在泡沫,并非只有具身行业如此。是不是泡沫,取决于是否有人真正推动技术进步,去戳破泡沫,将幻想转化为现实。

智客ZhiKer:您认为具身行业技术发展的速度,匹配的上估值增长的速度吗?

张直政:起码我们公司是完全匹配的。

从整个行业的视角来看,目前真正沉下心来挤掉泡沫、专注于达成目标的公司仍然占少数。大部分企业是因为行业热度驱动,然后讲述一些不完整、或浅显的故事来获取融资,这种现象确实存在。

智客ZhiKer:技术的飞速进步是支撑头部具身公司高估值的逻辑吗?

张直政:支撑头部具身智能公司的估值逻辑有两层。

第一层就是公司是不是在做实事,如世界模型一样,目标与行动契合。第二层是前沿研发与商业化落地的计划是不是有强相关性,能像齿轮一样咬合在一起。

智客ZhiKer:怎么判断一家具身智能公司是不是在做实事?

张直政:第一个逻辑是,有落地场景的优于真机演示,真机演示优于只能看视频的。

目前具身智能的宣传分三个阶段。第一阶段是演示Demo视频,成功率仅10%,只拍摄成功场景,也能剪辑成宣传视频。第二阶段是真机演示,机器人的各项功能直观呈现,成功或失败显露无遮。第三个阶段是商业化落地,实现真实场景应用。例如我们的太空舱项目、即时零售项目,以及工业场景搬运、分拣项目,都已经在长期、稳定地规模化运行。

第二个逻辑是,商业落地场景和技术路线是否一致。例如,某家公司声称在做大模型,但实际商业化落地并未采用大模型方案,仍在使用小模型及真机强化学习,这就意味着讲故事的技术与商业化进程是两条不相交的线。

我们公司在研发太空舱的过程中,最初采用的是模型与工程方案相结合的模式。随着技术的演进,逐步通过端到端的大模型实现了对整套系统的全面替代。这一突破就是我们所追求的前沿技术创新,它与商业化落地的技术路线高度一致,二者紧密耦合、相辅相成。

第一点可用来甄别企业的技术水平处在哪个阶段,第二个用于判断企业的研发与落地是否形成闭环,让技术研发与商业落地不再是两条松散的线,而构成可持续滚动的飞轮。

智客ZhiKer:具身智能公司最“烧钱”的是哪个环节?

张直政:首先是规模化采集数据并构建数据闭环,即在真实场景中部署应用,再将真实场景产生的数据回流至基础模型,从研发层面来看,这需要投入大量资金。

其次是软硬件耦合,实现硬件与软件适配,同时满足模型部署需求,且保持量产能力,这个过程同样需要高额资金投入。

智客ZhiKer:具身智能行业什么时候进去下半场?

张直政:如果上半场和下半场下一个定义的话,上半场需要头部具身智能公司针对某一个特定场景或业务,从头到尾跑通闭环。

最终,拥有基模和行业闭环能力具身智能公司不会超过3家。

下半场就会出现一堆做解决方案、做应用的公司,基于具身智能公司提供的基模能力、硬件能力,在新的场景里面做闭环验证。具身智能和自动驾驶行业非常不一样的点在于,自动驾驶只解决开车一个需求,但具身智能要解决各种各样的需求,工业、商业、家庭等等。

工业、零售等领域的部分场景应用进入下半场近在眼前了,而C端场景中对安全性、非结构性要求更高的应用需要更久。(作者|郭虹妘)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Continue Reading独家对话银河通用张直政:我们找到了VLA和世界模型的融合之路

孙杨接受采访时突然拿手机开始点餐:到饭点了啊

近日,孙杨接受知名主持人易立竞专访时,中途突然打断采访掏出手机点外卖,相关画面登上热搜。

采访中,孙杨聊到妻子张豆豆,他说自己陷入低谷的时候经常会听一首歌,叫《苦尽甘来》,并且觉得遇到妻子张豆豆就是苦尽甘来。

孙杨接受采访时突然拿手机开始点餐:到饭点了啊

孙杨说道:“我觉得经历很多,然后老天也比较眷恋我,给了我一个很好很优秀的媳妇,没有让我的人生受到二次伤害。”

正说着自己其实很独立,“你们看不到的地方都是她依赖我,相互依赖。我是属于那种有问题我先去解决,她因为是北方女孩嘛,可能性格比较刚烈一些。”,主持人问道:“你的那种挂脸的表情日常生活中多吗?”孙杨否认自己挂脸,并表示:“还好吧 我老婆比我更多,该吃饭了,到饭点了。”

孙杨接受采访时突然拿手机开始点餐:到饭点了啊

刚煽完情,话题转的易立竞愣了一下,问“你是饿了是吗?”孙杨回答:“也不到饿了,我就是到点我得吃饭,我来搜一下这个附近。”随即拿起手机搜索附近美食。

孙杨接受采访时突然拿手机开始点餐:到饭点了啊

易立竞说“你现在已经是坐卧难安了”,孙杨脱口而出“不是,屁股痛”,把主持人也逗笑了。易立竞只好让他“站起来搜”,孙杨照做,于是出现了站着搜外卖、主持人坐着等采访的画面。

这时候,工作人员过来解围:“孙杨老师,我们的餐备好了。”,两人转移到用餐区边吃边聊,采访才继续。

这段采访被网友热议。有人调侃“到点吃饭,刻在骨子里的运动员作息”,也有人觉得“这反应太真实了”。

孙杨此前在《妻子的浪漫旅行》中已贡献不少名场面——在俄罗斯点8杯热茶把嘉宾热到崩溃,一顿饭花了1.5万后直呼“太贵了”。这次采访时突然点外卖,又让网友看到了他“准时吃饭”的一面。非常随心随性的一位了。

Continue Reading孙杨接受采访时突然拿手机开始点餐:到饭点了啊