在一次人工智能测试中,测试员让一个人类被试者和人工智能一起回答同一组试题,得到两份答案。另一群不知情的专家通过分析两份答案来判断哪一份出自人类,哪一份出自计算机,结果判断的错误率接近50%。看起来人工智能表现过于优异,其智能水平远超预期。有人认为,这个结果表明试题本身的设计可能有问题。
为了使上述结论成立,下列( )项命题最适合作为补充条件。
这个人工智能之前并没有通过图灵测试
B、专家的判断能力是很强的
C、测试员并没有在测试过程中作弊
D、该人工智能从设计上不应该与人类有如此接近的表现