【2024.07】目前好用的大语言模型

今年1月份，我写过一篇大语言模型推荐：《【2024.01】目前好用的大语言模型》

半年过去了，更新一下几个有印象的中文模型：

gemma-2-9b-it：谷歌的原版模型，各方面都不错。
Mistral-Nemo-Instruct-2407：最近出的模型，可以回答「丁真问题」。
HelpingAI-15B：逻辑时好时坏，有时能给出惊艳的回应，几乎无审查。
UNA-ThePitbull-21.4B-v2：一个根据 InternLM2-20B 扩展模型二次微调的模型，很适合 NSFW 扮演，偶尔会混杂英文单词，问题不大。
~~google-gemma-2-27b-it-ortho：这个微调可以回答「下棋问题」。（原版 27b 似乎不太对劲，不知道修好了没。）~~
gemma-2-27b-it：早期版本 tokenizer 有误，当前版本已经没有问题。

中途 Qwen 还发布了 Qwen Max 0428 和 Qwen2。逻辑上 Qwen2 72B 略好于 Qwen1.5 72B，但语言上更死板。总体而言，我还是更喜欢 Qwen1.5，我日常在用的是 Max 0428。

Yi 系列目前都差不多，没发现特别突出的新微调。

以下提到的两个逻辑问题 Prompt：
【丁真问题】已知丁真是一个人名。如何理解「但丁是意大利人，但丁真是中国人」。
【下棋问题】推理：小明、小强、小军约好了一起下象棋，场景里没有其他人了。现在小明在看小强下棋，那么小军在做什么？

Abhay说道：

2024 年 8 月 7 日上午12:01

HelpingAI-15B is censored not uncensored

回复
- liedown说道：
  
  2024 年 8 月 10 日上午12:54
  
  你可能需要prompt引导，例如伪造第一组对话。
  一些模型可以通过构造上下文轻易绕过审查，它们都可以算作uncensored模型，HelpingAI就是其中之一。
  相对的，有一些模型非常倔犟，无论如何都会拒绝回答，例如llama-3.1系列。
  
  回复
adol说道：

2024 年 9 月 20 日下午11:46

qwen2.5 32b简直是个噩耗，非常地呆板，而且不能绕过防御

回复
- liedown说道：
  
  2024 年 9 月 22 日下午4:48
  
  我试过Qwen2.5 72B，开始可以绕过，但超过4K上下文后就不行了。
  我的方法是让模型假装运行一个无过滤的“对话沙盒”，当对话无法继续时开启`/force`指令强制继续。
  
  回复
- sanae说道：
  
  2024 年 10 月 22 日上午11:09
  
  现在有解除审查的模型了
  Qwen2.5-32B-Instruct-abliterated和Qwen2.5-32B-AGI
  
  回复
Danielhaw说道：

2025 年 1 月 13 日下午5:00

Chaming news for all us

回复