• 超越跑分,我们该如何评价AI大模型的智商?

    随着越来越多的模型性能接近GPT-4,几个主要的评测手段都已经无法进行有效区分。 1, MMLU,分数均80+分,已缺乏区分度。 2, MT-Bench,裁判员是GPT-4,能力不足以分辨模型之间的能力差别。 3, Arena Elo:主要是普通对话类任务,让Elo分数受到和人类对齐程度的极大 ...

    2024-05-21
  • 我们如何逻辑正确的做产品?

    人人都会做产品经理。 因为看起来做产品经理需要的门槛不是那么高,毕竟不像做工程师的话让你实现个功能你不会就无从下手,不像做设计师你不会的话弄出来的图片惨不忍睹自己都觉得辣眼睛…… 产品经理,人人都可以插一嘴,人人都可以觉得自己很认真的思考了(也许是真的很认真的思考了)然后讲了一堆原则和道理。我们 ...

    2024-04-30
  • 向往成功的人,总喜欢简单的故事。

    什么意思? 就拿…就拿我自己和你说吧。 小时候听说,瓦特因为看到开水蒸汽顶开了壶盖,受到了巨大启发,发明了蒸汽机。 我信了。 原来如此。瓦特的成功真简单,看一次看烧开水就悟了。 长大后我才知道,这是一个谣言。 在瓦特之前,蒸汽机已经被发明几十次了。 从古希腊的英雄机,到18世纪托马斯· ...

    2024-04-19
  • AI实时翻译现在已经达到一个什么样的水平了?

    语言本身就是较为复杂的体系,更别说从一种语言跳转到另一种了。 面对翻译这个问题,要追求百分百的完美实际上是非常困难的事情。 我做翻译这个产品很多很多年了。一些熟悉我的朋友可能知道,我最早是在金山软件做金山词霸这个产品的。 对早年中国软件和互联网历史熟悉的朋友可能知道,当年我们真是一步一步的 ...

    2024-04-18
  • AI大模型的未来是开源还是闭源?

    IT互联网领域容易发生马太效应赢家通吃,后来者往往会试图复制当年linux或者Android的道路,通过开源的方式寻求新的发展路径和开拓新的市场潜力。 OpenAI的强势让Meta的LLAMA和阿里的qwen等都选择了开源。 然而李彦宏认为开源没戏。 以下是李彦宏的几个核心论断。 1 ...

    2024-04-15
  • 一天赚1420万美元是啥感觉?

    一天赚1420万美元💵是啥感觉? 财富自由啦! 今天上午到办公室,循例打开AppStore的后台看我们的产品的一些经营数据。 结果,我们的主打产品AI语音实时翻译工具【Felo Translator】过去24小时在App Store上的收入超过了1420万美元,并且还在继续增加中!!!!! ...

    2024-04-11
  • 为什么有些网站前面不加 WWW?【旧文重发】

    原文最初发表于2008年4月16日,当时的linglingfa.com 博客上。后来于2015年在某个话题里被再次提起。今天是2024年4月,移动互联网大潮下我们回头再次看当年的话题,依然有意义。互联网很大,但是需要我们创造和建设互联网的人,有更大的能够包容互联网的情怀。————零零发,2024年4 ...

    2024-04-06