33337 . 全球唯一扩展了** openai** 库,实现Reranker模型(rerank, /v1/rerank)。(代码样例见gpt_server/tests/test_openai_rerank.py)
34348 . 全球唯一支持了** openai** 库的文本审核模型接口(text-moderation, /v1/moderations)。(代码样例见gpt_server/tests/test_openai_moderation.py)
35359 . 全球唯一支持了** openai** 库的TTS模型接口(tts, /v1/audio/speech),自带edge-tts(免费的TTS)(代码样例见gpt_server/tests/test_openai_tts.py)
36- 10 . 支持多模态大模型
37- 11 . 与FastChat相同的分布式架构
36+ 10 . 全球唯一支持了** openai** 库的ASR模型接口(asr, /v1/audio/transcriptions),基于fanasr后端(代码样例见gpt_server/tests/test_openai_transcriptions.py)
37+ 11 . 支持多模态大模型
38+ 12 . 与FastChat相同的分布式架构
39+ ## 配置文档
40+ 通过这个样例文件,可以很快的掌握项目的配置方式。
41+ <br >
42+ ** 配置文件的详细说明信息位于:[ config_example.yaml] ( https://github.com/shell-nlp/gpt_server/blob/main/gpt_server/script/config_example.yaml " 配置文件 ") **
3843
3944## 更新信息
4045
4146``` plaintext
47+ 2025-4-2 支持了 OpenAI的ASR接口 /v1/audio/transcriptions
48+ 2025-4-1 支持了 internvl2.5模型
42492025-2-9 支持了 QVQ
43502024-12-22 支持了 tts, /v1/audio/speech TTS模型
44512024-12-21 支持了 text-moderation, /v1/moderations 文本审核模型
@@ -209,19 +216,19 @@ Chat UI界面:
209216| Deepseek | deepseek | √ | √ | √ | √ |
210217| Llama-3 | llama | √ | √ | √ | √ |
211218| Baichuan-2 | baichuan | √ | √ | √ | √ |
212- | QWQ-32B | qwen | √ | √ | √ | √ |
219+ | QWQ-32B | qwen | √ | √ | √ | √ |
213220| Phi-4 | phi | √ | √ | × | × |
214221### ** VLM** (视觉大模型榜单 https://rank.opencompass.org.cn/leaderboard-multimodal)
215222
216223| Models / BackEnd | model_type | HF | vllm | LMDeploy TurboMind | LMDeploy PyTorch |
217224| :--------------: | :--------: | :---: | :---: | :----------------: | :--------------: |
218225| glm-4v-9b | chatglm | × | × | × | √ |
219- | InternVL2 | internvl | × | × | √ | √ |
220- | InternVL2.5 | internvl | × | × | √ | √ |
226+ | InternVL2 | internvl | × | × | √ | √ |
227+ | InternVL2.5 | internvl | × | × | √ | √ |
221228| MiniCPM-V-2_6 | minicpmv | × | √ | √ | × |
222229| Qwen2-VL | qwen | × | √ | × | √ |
223- | Qwen2.5-VL | qwen | × | × | × | √ |
224- | QVQ | qwen | × | √ | × | × |
230+ | Qwen2.5-VL | qwen | × | × | × | √ |
231+ | QVQ | qwen | × | √ | × | × |
225232<br >
226233
227234### Embedding/Rerank/Classify模型
@@ -232,24 +239,41 @@ Chat UI界面:
232239
233240以下模型经过测试可放心使用:
234241
235- | Embedding/Rerank/Classify | HF | Infinity |
236- | --------------------------------------------- | --- | -------- |
237- | bge-reranker | √ | √ |
238- | bce-reranker | √ | √ |
239- | bge-embedding | √ | √ |
240- | bce-embedding | √ | √ |
241- | puff | √ | √ |
242- | piccolo-base-zh-embedding | √ | √ |
243- | acge_text_embedding | √ | √ |
244- | Yinka | √ | √ |
245- | zpoint_large_embedding_zh | √ | √ |
246- | xiaobu-embedding | √ | √ |
247- | Conan-embedding-v1 | √ | √ |
248- | KoalaAI/Text-Moderation(文本审核/多分类,审核文本是否存在暴力、色情等) | × | √ |
242+ | Embedding/Rerank/Classify | HF | Infinity |
243+ | ----------------------------------------------------------------------------------- | --- | -------- |
244+ | bge-reranker | √ | √ |
245+ | bce-reranker | √ | √ |
246+ | bge-embedding | √ | √ |
247+ | bce-embedding | √ | √ |
248+ | puff | √ | √ |
249+ | piccolo-base-zh-embedding | √ | √ |
250+ | acge_text_embedding | √ | √ |
251+ | Yinka | √ | √ |
252+ | zpoint_large_embedding_zh | √ | √ |
253+ | xiaobu-embedding | √ | √ |
254+ | Conan-embedding-v1 | √ | √ |
255+ | KoalaAI/Text-Moderation(文本审核/多分类,审核文本是否存在暴力、色情等) | × | √ |
249256| protectai/deberta-v3-base-prompt-injection-v2(提示注入/2分类,审核文本为提示注入) | × | √ |
250257
251258目前 TencentBAC的 ** Conan-embedding-v1** C-MTEB榜单排行第一(MTEB: https://huggingface.co/spaces/mteb/leaderboard )
252259
260+ <br >
261+
262+ ### ** ASR** (支持FunASR非实时模型 https://github.com/modelscope/FunASR/blob/main/README_zh.md)
263+ 目前只测试了SenseVoiceSmall模型(性能最优的),其它模型的支持情况只是从官方文档中拷贝过来,不一定可以正常使用,欢迎测试/提issue。
264+
265+ | Models / BackEnd | model_type |
266+ | :--------------------: | :--------: |
267+ | SenseVoiceSmall | funasr |
268+ | paraformer-zh | funasr |
269+ | paraformer-en | funasr |
270+ | conformer-en | funasr |
271+ | Whisper-large-v3 | funasr |
272+ | Whisper-large-v3-turbo | funasr |
273+ | Qwen-Audio | funasr |
274+ | Qwen-Audio-Chat | funasr |
275+
276+ <br >
253277
254278## 架构
255279
0 commit comments