这两天数码圈又炸了一次,这回争议的焦点,是红魔11 Pro和红魔11 Pro+被3DMark官方直接从榜单里拿掉了。

事情说复杂也不复杂。UL Solutions,也就是3DMark背后的官方团队,给出的结论很明确:这两款手机在跑3DMark时,存在识别应用并进行专门优化的情况。更直白一点说,就是手机会认出“这是3DMark”,然后给出一套和平时不太一样的性能策略。

官方为什么下这个判断,不是空口说白话,他们做了对照测试。

测试团队准备了两套内容完全一样的软件,一套是大家能在Google Play正常到的公开版3DMark,另一套则是不对外公开、连厂商也接触不到的更名版本。两个版本测的内容相同,但最终结果却差得非常夸张:公开版跑出来的成绩,比私有更名版高了整整24%。

24%这个差距,已经不是误差能解释的范围了。3DMark方面据此认定,涉事机型并不是在所有场景下都能稳定输出这种性能,而是通过识别软件名称,专门对基准测试做了特别处理。这在他们的规则里,属于明确禁止的行为。

所以处理结果也很直接:红魔11 Pro、红魔11 Pro+的3DMark成绩被全部作废,并从性能排名中移除。什么时候恢复,要看厂商后续是否修正相关问题。

这次事件的源头,来自上个月YouTube用户Saityo的投诉。对方认为红魔11 Pro的跑分表现不太正常,3DMark团队接到反馈后才展开调查,最后一步步把问题坐实。

更让人皱眉的是,调查不只是发现“分数不正常”这么简单。

UL Solutions在说明里提到,手机一旦识别到公开版3DMark正在运行,会突破原本的系统安全限制,即使温度不断升高,依然持续把性能往上顶。与此系统还会自动进入类似“暗黑模式(Diablo Mode)”的高性能状态,而且测试人员在测试过程中找不到关闭它的办法。

但平时正常使用,或者一般游戏场景下,这款手机其实是有完整温控和降频机制的。换句话说,榜单上那份漂亮成绩,并不能真实代表大多数用户日常能碰到的表现。

还有一个细节,比跑分本身更值得注意。

在测试过程中,涉事机型局部表面温度一度超过50℃。UL Solutions专门提醒了风险:这个温度可能带来低温烫伤。它不像瞬间碰到高温那样立刻让人缩手,但会持续把热量传到皮肤深层,等你开始感觉刺痛、发红,甚至起小水泡的时候,内部组织可能已经受到了损伤。

所以这件事之所以闹大,不只是因为“榜单分数好不好看”,还牵扯到了测试客观性,以及设备在极限策略下的安全边界。

面对外界质疑,努比亚这边的态度也很强硬,没有认错的意思。

官方回应大概可以概括成一句话:我们不是作弊,而是在展示硬件真正的上限。按照他们的说法,红魔和普通手机不一样,它本身就主打游戏性能,内部有物理风扇和液冷,设计目标就是为了扛住高负载。只要用户进入游戏空间,手动开启“暗黑模式”,就可以解锁和基准测试里类似的功耗与散热能力,像高负载模拟器之类的场景,也确实可能用得上。

努比亚的逻辑其实不难理解:既然这个性能档位是用户能主动打开的,那跑分展示这个上限,并不算欺,反而是一种透明。

但3DMark并不认这个说法。

他们强调,基准测试存在的意义,不是替厂商展示某个极端条件下的理论峰值,而是给普通用户一个尽量客观、可横向比较的参考,看看这台手机在真实、常见的使用状态下,游戏性能大概处在什么位置。如果手机只在识别到测试软件时才进入特别激进的模式,那这个成绩自然就失去了对比价值。

说到底,双方争论的核心其实就一个:跑分到底该测“平时能稳定用到的表现”,还是“功能全开时能冲到多高”。

站在厂商角度,他们会觉得,既然性能模式真实存在,用户也能自己开,那就不算假成绩。

站在测试平台角度,他们更在意的是公平。因为一旦允许设备识别测试软件,再给它上“特供状态”,那榜单就很容易变味。今天你给3DMark开小灶,明天别人也可以跟进,最后用户看到的就不是手机真实差距,而是谁更会“做题”。

截至红魔11 Pro和红魔11 Pro+在3DMark榜单上已经没有排名,也没有有效分数,在热门最佳智能手机榜单里被放到了最底部。官方也明确提示,这两款机型当前的3DMark成绩,不能再拿来和别的手机做性能比较。

这件事我个人看下来,问题不在于厂商愿不愿意把性能压榨到极限,而在于这种极限状态是不是只对跑分软件开放。如果它是一个用户在日常里可以清楚开启、也能稳定复现的通用模式,那至少还有讨论空间;可如果它会主动识别测试应用,再偷偷切换策略,那本质上就已经偏离了公平测试的初衷。

你可以说它展示了上限,但很难说它展示了真实。

至于这算不算作弊,其实很多人心里已经有答案了。真正让用户反感的,从来不只是分数高低,而是“你看到的,和你实际用到的,究竟是不是一回事”。

红魔11 Pro系列被3DMark除名,跑分高24%的背后,到底算不算作弊?