GPT系列演进
从GPT-1到GPT-4的规模与能力跃迁
Scaling Law: 性能 ∝ 参数量^α · 数据量^β · 计算量^γ
GPT-1: 117M → GPT-2: 1.5B → GPT-3: 175B → GPT-4: ~1.8T
点击模式按钮查看演进
核心洞察: 规模扩大带来涌现能力
参数量增长
能力跃迁
涌现能力
↻ 重置