无 vllm 环境下使用。 bug: 请求时,stream =true, 时会返回空,必须设置 stream =False 参考自: https://github.com/leisc/glm4_openai_api_server_mps