1.AI常规测试:
采用InceptionV3、MobileNetV1SSD、ESRGAN、StyleTransfer这4种主流神经网络模型;
进行图像分类、对象识别、超分和风格迁移四项关键测试。
基于准确率和速度,提供直观的评分报告,评估手机处理日常AI任务的性能水平。
2.AI大模型测试:
采用真实场景测试法,针对实际生活中的知识问答和文字处理任务进行测试。
以国内主流的通义千问(QWen1.5)4B端侧Chat大模型(开源版)作为基准测试模型。
全面考察模型加载时间、输入输出速度、回答准确度等指标,聚焦设备处理复杂、计算密集型AI任务的能力。
1.常规测试和大模型测试,分别针对日常AI任务和复杂AI任务,全面覆盖不同场景下的设备AI性能评估。
2.大模型测试告别理论性测试,结合实际生活中的知识问答和文字处理任务,让测试结果更具参考意义。
3.优先使用各品牌厂商提供的专属SDK,充分释放设备潜能,确保测试结果的准确性。
1.采用主流的神经网络模型和基准测试模型,测试方法科学,能客观反映设备的AI性能。
2.从日常简单AI任务到复杂计算密集型AI任务,从多个维度进行评估,结果全面。
3.提供直观的评分报告,让用户能清晰了解设备AI性能的强弱,便于进行设备对比等操作。
应用信息
相关推荐
更多版本