其实现在GPT3.5可能还是最实用的大模型没有之一
因为便宜。
总体来说,GPT-4o的API使用价格是GPT-3.5-turbo-0125的20倍左右。这种价格差异反映了两个模型在性能和能力上的巨大差距。但是不能说3.5就是垃圾,因为有的事情GPT3.5干的挺好的,比如说,一般的翻译。
我们做Felo 以来面临的巨大问题就是AI翻译的成本高昂。毕竟网络上的竞争对手不论是Google Translate还是 Deepl,人家的价格都是“零”。
如何降低成本就成了使用AI 服务最终要的事情之一。
不过今天我们不讨论3.5和4o的问题,我聊聊3.5 的模型的两个版本。
GPT-3.5-turbo-0125 和 GPT-3.5-turbo-1106
一般来说我们总觉得更新发布的模型会更好,从这个角度来说,0125比1106更新,并且,价格还更便宜:
GPT-3.5-turbo-1106:
- 输入令牌每百万收费$1.00
- 输出令牌每百万收费$2.00
GPT-3.5-turbo-0125:
- 输入令牌每百万收费$0.50
- 输出令牌每百万收费$1.50。
实际用起来0125能比1106的成本降低至少三分之一。
但是这也不是说1106就毫无价值。因为两个模型的输出能力有明显的差别:
最大输出令牌数:
GPT-3.5-turbo-1106:最大输出令牌数为16,384。
GPT-3.5-turbo-0125:最大输出令牌数为4,096。
仅仅对于翻译服务来说,不少用户不是希望通过AI翻译简单的一句话或者一个单词,而是希望能给一整段,一大篇文章给出翻译结果。这时候更大的输出能力其实就变得有意义起来。
虽然根据OpenAI自己的介绍,0125相比较于1106有了不少改进,更加稳定,也似乎更“准确”。
但是第一,对于AI来说很多推理场景什么叫“准确”是缺乏明确定义的。
第二,真想要更准确的AI ,请使用ChatGPT 4o。
事实上在Twitter上也看到一些用户报告说,GPT-3.5-turbo-0125在某些应用场景中表现不如GPT-3.5-turbo-1106。
我并不认为1106会比0125更好。只是想和所有正在使用ChatGPT做AI服务或者产品的朋友交流一下,我觉得如果你在产品的性能和成本之间做好平衡的选择,确认要使用ChatGPT3.5的时候,也别忘了再认真评估一下使用哪个版本的3.5 。至少从我的经验来看,1106不是不在考虑之列的。
要记住,无论做任何商业产品,成本都是影响你商业发展最重要的因素之一。
btw:如果认真测试后效果能接受,其实Gemini1.5也很便宜,且不是不能用。