今年1月份,我写过一篇大语言模型推荐:《【2024.01】目前好用的大语言模型

半年过去了,更新一下几个有印象的中文模型:

  1. gemma-2-9b-it:谷歌的原版模型,各方面都不错。
  2. Mistral-Nemo-Instruct-2407:最近出的模型,可以回答「丁真问题」。
  3. HelpingAI-15B:逻辑时好时坏,有时能给出惊艳的回应,几乎无审查。
  4. UNA-ThePitbull-21.4B-v2:一个根据 InternLM2-20B 扩展模型二次微调的模型,很适合 NSFW 扮演,偶尔会混杂英文单词,问题不大。
  5. google-gemma-2-27b-it-ortho:这个微调可以回答「下棋问题」。(原版 27b 似乎不太对劲,不知道修好了没。)
  6. gemma-2-27b-it:早期版本 tokenizer 有误,当前版本已经没有问题。

中途 Qwen 还发布了 Qwen Max 0428 和 Qwen2。逻辑上 Qwen2 72B 略好于 Qwen1.5 72B,但语言上更死板。总体而言,我还是更喜欢 Qwen1.5,我日常在用的是 Max 0428。

Yi 系列目前都差不多,没发现特别突出的新微调。

以下提到的两个逻辑问题 Prompt:
【丁真问题】已知丁真是一个人名。如何理解「但丁是意大利人,但丁真是中国人」。
【下棋问题】推理:小明、小强、小军约好了一起下象棋,场景里没有其他人了。现在小明在看小强下棋,那么小军在做什么?