阿里快乐马上线,海外观众还在求开源

2026-04-29 12:47
上海

万众期待的快乐马(happyhorse)终于上线。

4月27日,阿里宣布HappyHorse1.0正式开启灰测。灰测阶段,创作者可在HappyHorse官网和阿里云百炼平台注册使用,普通用户可到千问App最新版或官方创作平台体验。

字节非常贴心地发布了即梦更新,图标换成了抓马,什么马都抓,甭管你是horse还是pony。

快乐马此前亮相的时候,使用了行业内备受好评的匿名冲榜方案。当它真像一匹脱缰的野马,登顶各大榜单的时候,你很难不疑惑:这是谁的部将?

大家开始其实都不太相信是阿里的,因为阿里没有发布过很牛逼的视频生成模型。而且自己不是内容平台,缺乏抖音和快手的先天优势。

最后新成立的ATH事业群出来认领,也算是扬眉吐气了。

快乐马来得很是时候,林俊旸前脚离职引发人才流失和研发前景的焦虑,阿里马上用顶尖模型予以回击,看起来确实有打喷子脸的效果。

当然这两件事本身没有直接联系,模型研发起码也要好几个月,不是三月上马,四月就能下马的。

快乐马出来后,有人去翻负责人张迪的履历,发现张迪开始是阿里星,后来去快手做可灵技术负责人,去年才回流阿里领导淘天旗下的未来生活实验室。

而更早之前负责千问的周畅,被字节挖走后带队做出了 Seedance2.0 。甚至现在做可灵的盖坤,当初也是阿里星。

所以这么来说,这两件事好像又有点联系,因为人才的来去没有明显影响到阿里作为技术组织应对变革的能力。

而林俊旸离开引发的关于开闭源的讨论,现在确实有趋势调整的风头。

吴泳铭当时回应,称阿里将继续坚持开源模型策略,这个策略看起来有些避重就轻了。

阿里不会完全转向闭源,但以后开源范围将限制在较小的模型尺寸,大尺寸模型版本将保留给内部卖MaaS。

最新的Qwen3.6系列开源尺寸为35B或27B参数,Qwen3.6-plus只能通过阿里平台使用。官网发布页也只提到“将开源更小规模的模型版本,以此重申我们对技术普惠与社区驱动创新的坚定承诺。”

林俊旸离开不是上述调整的原因,但减少了推进的内部阻碍。

他年初曾在某个论坛上表示,自己希望推进Qwen3-Max大模型的开源,但未能如愿。

视频生成模型那边,也是类似的过程。阿里通义万相开源到wan2.2,年初发布wan2.6则开始闭源。而且视频模型闭源其实引起了更多争论。

因为你别看当初Sora或者Veo这些模型闹得很欢,但视频跟文本两个东西可用性上有很大差异。

你现在用大模型写文章或者小说,它的完整度可以做到很高。但你用视频模型即便只生成一段10s的视频,抽几十次卡经常都难以达到满意的效果。

所以视频模型出来后,开源社区能做的事情更多。

这一点在wan生态上体现得非常明显。

最早的wan2.1模型,无论是T2V还是I2V,当时基模能力虽然比其他开源模型强,但也相当粗糙。社区贡献了大量工作来提升使用体验。

比如lightx2v这类项目,重构了从采样策略到显存优化的一系列推理流程,降低了延迟和成本,同时提高了稳定性。

又比如各种LoRA和轻量化版本,在基础模型之上添加了很多功能。

甚至连美团都跟学术界合作,在wan2.1这个基模上面,搞出来InfiniteTalk这种解决方案,明显优化了从音频驱动、唇形同步到长视频一致性等方面的能力。

好在当时外卖大战还没开始,不算投敌。

这些社区贡献的东西,都是开源且容易复现的。因此大家都会默认,你后续会从里面吸收东西。

阿里如果一直开源,这显然是个两方各自互惠,推动技术进步的好案例。

但当阿里从开源转向闭源,就免不了有人抱怨你之前是吊开源的凯子,把社区好的工程实践和idea拿走就不玩了。

事实上,快乐马最新帖子下面,还有海外观众在呼吁开源。我说实话多少有点看不清形势了。

下面聊聊我具体实测快乐马 vs seedance2.0 vs kling3.0 的情况。

提示词:

第一人称视角(主人视角),镜头中不出现主人身体。两只金毛犬坐在镜头前的地面上,专注地盯着即将被丢出的烧饼。主人将一个烧饼从镜头前方抛出,烧饼在空中形成清晰抛物线。

左边的金毛在烧饼刚被抛出的瞬间立刻起跳,张开嘴试图接住烧饼,但在空中判断失误,没有咬到。烧饼从它嘴边擦过并继续下落。右边的金毛保持冷静,没有起跳,而是在地面等待。烧饼落地后被右边的金毛迅速叼走。两只狗动作自然流畅,反应真实,避免夸张或卡顿。

这个提示词是我从经常刷到的一个短视频博主那里抽取出来的。他有两只金毛,其中一只明显更聪明,每次扔烧饼都是先等另外只傻狗上去接,等接不住掉地下,它提前预判点位抢到手。

下面左上是快乐马、右上是seedance2.0、左下是kling3.0、右下是veo3.1。

生成结果质量排序,我觉得是seedance2.0 ≈ kling3.0 > 快乐马 > veo3.1。

veo3.1属于是拉到没法看,烧饼居然是从狗的嘴里凭空冒出来的,完全的surprise,totally awesome。

seedance2.0和kling3.0结果基本差不多,都比较真实,但都有个小破绽。

seedance2.0是烧饼落到地上跳得太高,kling3.0则是烧饼落地后另一只狗楞了几秒才从地上叼起来,而我提示词里说的是“迅速叼走”。

快乐马这边问题更多一些。画面太假,两只狗看起来很像是cg的。有穿帮画面,烧饼先掉到狗的鼻子上,结果下一秒就跳到嘴里了。另外也没有呈现烧饼落到地上的画面,呈现不够完整。

所以上面的排序虽然是我觉得,但我觉得还是比较客观的。

提示词:

第一人称视角,画面中不出现主人。真实环境风格,光照自然。一只猫站在桌子上,桌边放着一个装有水的玻璃杯。猫明显有点心虚,一边用前爪轻轻把水杯往桌边推,一边缓慢后退,同时不断抬头看向镜头方向,动作带有试探、犹豫和停顿。水杯在桌面上先是缓慢移动。

推动过程中存在短暂停顿和再次推动的行为。当水杯越过桌边后开始下落,下落速度逐渐加快,符合重力加速度。水杯落地后倾倒或破裂,杯中的水向四周飞溅,水的运动轨迹自然连续,不粘连、不异常变形。猫在水杯掉落后迅速低头看向地面,保持警惕状态。所有运动过程连续自然,无瞬移、无物体消失或重复,符合基本物理规律。

这个提示词大家的表现就非常一致了,全都烂到令我道心破碎。

不是,到底尼玛哪些人在说现实不存在了啊?每次出个新模型都在那刷,现实崩了这么多次大伙还在,平行宇宙理论被实锤了。

这四个模型没有那个呈现出一丁点猫推杯子的动作。

快乐马的视频上来猫猫脚上像沾了胶水,碰到就开始把玻璃杯往外面拉。往外拉的时候,玻璃杯倒扣过来,水居然没往下落,物理学不存在了我只能说。而且杯子落到地上碎渣四溅,但回头看玻璃杯又完好无损。

seedance2.0视频里则是猫完全没碰杯子,杯子在水平桌面上受到信念感召自动下落。水杯落到地面后,跟小区门口六十岁的大爷一样站得笔直。

kling3.0也是同样的问题,在猫未接触杯子的情况下,杯子产生自我意识碰瓷我猫哥。另外,画面也没有呈现出杯子落地的效果。

veo3.1稍微好点,猫脚虽然还是没推杯子,但还是碰了下杯子。杯子倾倒后水没流出来,照样不受重力影响。落地后杯子破碎的效果倒是有,但是玻璃渣子多到完全跟一个杯子不对应。

上面这几个视频不一定客观反映模型的能力差异,有可能我的测试数据太少,毕竟AI视频生成经常需要大量抽卡。

但仅从这些有限的初步测试看,快乐马的模型跟其他家有没有特别明显的差距。

不过目前价格上阿里给了很大折扣,专业会员包月后可以做到最低0.44元/秒,性价比还是拉满的。

当然,这些评价的前提就是快乐马不开源,快乐马只要立马开源,我将立马带头冲锋,将其奉为真神。

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。