国产大模型画鸟哪家强?
这个看似简单的任务, 却不容易做到。
2024-11-09
aisvg国产大模型
一个测试
让AI画一只鹈鹕骑自行车 —— 这听起来有点荒诞。
但这个看似简单的任务, 却暗藏玄机。 为什么?
首先, AI需要真正理解"鹈鹕"和"自行车"这两个风马牛不相及的概念。 光是这一点就很有挑战性。
更难的是, AI还要用SVG格式来画。 SVG不是普通的图片, 它是用代码描述的矢量图形。 每一条线、每个形状, 都需要精确的数学计算。
国产大模型的能否顺利画出呢...
测试代码来自:simonw/pelican-bicycle
prompt:Generate an SVG of a pelican riding a bicycle
公平起见,每个模型都同相同的提示词并使用官方API+默认参数测试,每个模型生成三次。
先卖个关子: 猜猜看,下面这些作品分别出自哪家AI之手?
我找来了目前最强的六位"选手":
- 豆包
- 智谱
- 月之暗面
- Deepseek
- 阿里通义千问
- 百度文心一言
用都是各家最新的主力模型, 实力都不容小觑。
太抽象了 怎么样? 有没有猜对哪些是出自哪家之手?
让我们来揭晓答案...
svg-test 模型以及对应公司
deepseek 深度求索;百度文心一言 ERNIE-4.0-8K;智谱 glm-4-plus;字节豆包 doubao-pro;阿里千问 qwen-max-latest;月之暗面 moonshot-v1-8k;
对比看下御三家的最新模型:
虽然不能