国产大模型画鸟哪家强?

AI绘制鹈鹕骑自行车

这个看似简单的任务, 却不容易做到。

2024-11-09

aisvg国产大模型

一个测试

让AI画一只鹈鹕骑自行车 —— 这听起来有点荒诞。

但这个看似简单的任务, 却暗藏玄机。 为什么?

首先, AI需要真正理解"鹈鹕"和"自行车"这两个风马牛不相及的概念。 光是这一点就很有挑战性。

更难的是, AI还要用SVG格式来画。 SVG不是普通的图片, 它是用代码描述的矢量图形。 每一条线、每个形状, 都需要精确的数学计算。

国产大模型的能否顺利画出呢...

测试代码来自:simonw/pelican-bicycle

prompt:Generate an SVG of a pelican riding a bicycle

公平起见,每个模型都同相同的提示词并使用官方API+默认参数测试,每个模型生成三次。

先卖个关子: 猜猜看,下面这些作品分别出自哪家AI之手?

我找来了目前最强的六位"选手":

  • 豆包
  • 智谱
  • 月之暗面
  • Deepseek
  • 阿里通义千问
  • 百度文心一言

用都是各家最新的主力模型, 实力都不容小觑。

picture 3

太抽象了 怎么样? 有没有猜对哪些是出自哪家之手?

让我们来揭晓答案...

svg-test 模型以及对应公司

deepseek 深度求索;百度文心一言 ERNIE-4.0-8K;智谱 glm-4-plus;字节豆包 doubao-pro;阿里千问 qwen-max-latest;月之暗面 moonshot-v1-8k;

对比看下御三家的最新模型:

picture 4

虽然不能