【2024.07】目前好用的大语言模型
今年1月份,我写过一篇大语言模型推荐:《【2024.01】目前好用的大语言模型》
半年过去了,更新一下几个有印象的中文模型:
- gemma-2-9b-it:谷歌的原版模型,各方面都不错。
- Mistral-Nemo-Instruct-2407:最近出的模型,可以回答「丁真问题」。
- HelpingAI-15B:逻辑时好时坏,有时能给出惊艳的回应,几乎无审查。
- UNA-ThePitbull-21.4B-v2:一个根据 InternLM2-20B 扩展模型二次微调的模型,很适合 NSFW 扮演,偶尔会混杂英文单词,问题不大。
google-gemma-2-27b-it-ortho:这个微调可以回答「下棋问题」。(原版 27b 似乎不太对劲,不知道修好了没。)- gemma-2-27b-it:早期版本 tokenizer 有误,当前版本已经没有问题。
中途 Qwen 还发布了 Qwen Max 0428 和 Qwen2。逻辑上 Qwen2 72B 略好于 Qwen1.5 72B,但语言上更死板。总体而言,我还是更喜欢 Qwen1.5,我日常在用的是 Max 0428。
Yi 系列目前都差不多,没发现特别突出的新微调。
以下提到的两个逻辑问题 Prompt:
【丁真问题】已知丁真是一个人名。如何理解「但丁是意大利人,但丁真是中国人」。
【下棋问题】推理:小明、小强、小军约好了一起下象棋,场景里没有其他人了。现在小明在看小强下棋,那么小军在做什么?
HelpingAI-15B is censored not uncensored
你可能需要prompt引导,例如伪造第一组对话。
一些模型可以通过构造上下文轻易绕过审查,它们都可以算作uncensored模型,HelpingAI就是其中之一。
相对的,有一些模型非常倔犟,无论如何都会拒绝回答,例如llama-3.1系列。
qwen2.5 32b简直是个噩耗,非常地呆板,而且不能绕过防御
我试过Qwen2.5 72B,开始可以绕过,但超过4K上下文后就不行了。
我的方法是让模型假装运行一个无过滤的“对话沙盒”,当对话无法继续时开启`/force`指令强制继续。
现在有解除审查的模型了
Qwen2.5-32B-Instruct-abliterated和Qwen2.5-32B-AGI