其实现在GPT3.5可能还是最实用的大模型没有之一

因为便宜。

总体来说,GPT-4o的API使用价格是GPT-3.5-turbo-0125的20倍左右。这种价格差异反映了两个模型在性能和能力上的巨大差距。但是不能说3.5就是垃圾,因为有的事情GPT3.5干的挺好的,比如说,一般的翻译。

我们做Felo 以来面临的巨大问题就是AI翻译的成本高昂。毕竟网络上的竞争对手不论是Google Translate还是 Deepl,人家的价格都是“零”。

如何降低成本就成了使用AI 服务最终要的事情之一。

Chatgpt3.5or4

不过今天我们不讨论3.5和4o的问题,我聊聊3.5 的模型的两个版本。

GPT-3.5-turbo-0125 和 GPT-3.5-turbo-1106

一般来说我们总觉得更新发布的模型会更好,从这个角度来说,0125比1106更新,并且,价格还更便宜:

GPT-3.5-turbo-1106:

  • 输入令牌每百万收费$1.00
  • 输出令牌每百万收费$2.00

GPT-3.5-turbo-0125:

  • 输入令牌每百万收费$0.50
  • 输出令牌每百万收费$1.50。

实际用起来0125能比1106的成本降低至少三分之一。

但是这也不是说1106就毫无价值。因为两个模型的输出能力有明显的差别:

最大输出令牌数:
GPT-3.5-turbo-1106:最大输出令牌数为16,384。
GPT-3.5-turbo-0125:最大输出令牌数为4,096。

仅仅对于翻译服务来说,不少用户不是希望通过AI翻译简单的一句话或者一个单词,而是希望能给一整段,一大篇文章给出翻译结果。这时候更大的输出能力其实就变得有意义起来。

虽然根据OpenAI自己的介绍,0125相比较于1106有了不少改进,更加稳定,也似乎更“准确”。

但是第一,对于AI来说很多推理场景什么叫“准确”是缺乏明确定义的。

第二,真想要更准确的AI ,请使用ChatGPT 4o。

事实上在Twitter上也看到一些用户报告说,GPT-3.5-turbo-0125在某些应用场景中表现不如GPT-3.5-turbo-1106。

我并不认为1106会比0125更好。只是想和所有正在使用ChatGPT做AI服务或者产品的朋友交流一下,我觉得如果你在产品的性能和成本之间做好平衡的选择,确认要使用ChatGPT3.5的时候,也别忘了再认真评估一下使用哪个版本的3.5 。至少从我的经验来看,1106不是不在考虑之列的。

要记住,无论做任何商业产品,成本都是影响你商业发展最重要的因素之一。

btw:如果认真测试后效果能接受,其实Gemini1.5也很便宜,且不是不能用。