神秘「欢乐马」霸榜视频模型!本以为 Seedance 2.0 已封神…

青青百科 百科资讯 1

一个神秘模型 ——HappyHorse-1.0 悄然登顶 Artificial Analysis 的 AI Video Arena 排行榜,力压 Seedance 和可灵。

从昨天开始,它在文本转视频(无音频)赛道便登顶第一。根据当前实时数据,其 Elo 分数已达到 1375,直接甩开第二名 Seedance 2.0 大概 100 分左右。

这个分差相当夸张,简直是断层式碾压。要知道,从第二名的 Seedance 2.0 到第十名,相差也不过 50 分左右。

在图像转视频(无音频)赛道,它更是跑出了 1409 的恐怖高分,刷新了该榜单的历史纪录。

而在有音频赛道,目前 HappyHorse-1.0 也已经拿下全球第一的成绩,超越 Seedance 2.0。

多方消息称,HappyHorse-1.0 出自阿里旗下张迪领衔的淘天集团未来生活实验室。

屠榜视频 Arena

Artificial Analysis 的 Video Arena 的排名机制,是数千名真实用户在完全不知情的情况下,对两段生成结果进行盲测对比得出的 Elo 体系。

也就是说,多数用户在不知道视频由哪家模型生成的情况下,选择了 HappyHorse-1.0。

我也迫不及待地上手试了一下,在连续几次盲测都选中「欢乐马」之后,我开始感觉它的实力真的不容小觑。

先看第一个案例:

对比两个视频,可以明显看出右边的生成效果更具真实感,细节也更加丰富。无论是整体色调还是镜头的设置,都很像一个电影开场。

而左边的嘛…… 虽然提示词要求“血红色的天空背景”,但这天空未免也太红了,有点过于夸张。

选择之后答案揭晓:右边是「欢乐马」,左边是 Pyramid-Flow。

再来看看这个:

很显然,右边的画面更加自然,特写-近景-远景的镜头切换也很流畅,完全还原了提示词要求的“长枪短炮”的新闻发布会场面。

相比之下,左边的效果一开场就显得有些怪异,主人公站的位置不太合理,也没有营造出足够热烈的现场氛围。

答案揭晓 —— 右边是「欢乐马」,左边则是 Veo 3.1 Lite。

接下来是第三个案例:

可能因为输入了提示图片,这两个模型的生成效果乍一看差不多。

但我还是选择了右边。原因是左边的镜头拉近速度有点太快了,不太符合现场专注工作的安静氛围。

并且右边的镜头拉近之后,会发现人物脸上的纹理被还原得更好,更具真实感;而左边人物则显得面部太光滑了。

投票之后,答案又揭晓了:右边还是这匹「欢乐马」,左边则是 PixVerse V6。

盲测了十几个案例之后,但凡出现「欢乐马」的,我大部分都选中了,只有少数几个案例我没有选择「欢乐马」而选了其他模型。

这实力可想而知,也难怪空降屠榜了。

根据目前已知消息,Happy Horse-1.0 采用 40 层单流 Transformer 架构,原生支持音视频同步生成,仅需 8 步去噪即可输出 1080P 视频。

在 H100 显卡上生成 5 秒片段仅需 38 秒,推理速度较传统模型大幅提升。其技术突破包括多模态统一建模、无 CFG 引导生成等。

原生支持中文(包括粤语)、英语、日语、韩语、德语、法语。

更重要的是,据说完全开源 —— 基础模型 + 蒸馏模型 + 超分 + 推理代码,都会开源出来。

或出自阿里淘天

关于 Happy Horse-1.0 背后是哪家公司,目前猜测主要集中在国内。

而在众多选项中,呼声最高的是阿里淘天未来生活实验室,由前快手 Kling 一号位张迪领导。

张迪,上海交通大学本硕毕业,职级 P11,直接向淘天集团首席科学家兼阿里妈妈 CTO 郑波汇报。

他于 2010 年毕业后便加入阿里,担任资深技术专家,负责阿里妈妈大数据与机器学习工程架构。

2020 年,他曾转战快手,历任技术副总裁、大模型与多媒体技术团队负责人。在快手,他牵头了可灵大模型的底层架构研发与应用落地,成功推出了可灵 1.0/2.0 视频生成模型。

2025 年 9 月初,张迪加入哔哩哔哩,出任技术条线负责人。

2025 年 11 月,张迪离开哔哩哔哩,重返阿里,担任淘天集团未来生活实验室负责人。

目前,Happy Horse-1.0 还处于无官网(目前出现的几个官网都被打假了)、无技术报告、无代码库的状态。

有消息称团队现在每晚都在加班加点,10 号会正式发布,也是可以期待一下了。

本文来自微信公众号:量子位(ID:QbitAI),作者:听雨