Fix openai_api_server request_id issue

add request_id=f"{time.time()}" to Fix API concurrency request issue
2024-06-06 12:37:26 +08:00 · 2024-06-06 12:37:26 +08:00 · 0b979f8bdb
parent 1683d673d2
commit 0b979f8bdb
1 changed files with 1 additions and 1 deletions
--- a/basic_demo/openai_api_server.py
+++ b/basic_demo/openai_api_server.py
@ -195,7 +195,7 @@ async def generate_stream_glm4(params):
        "skip_special_tokens": True,
    }
    sampling_params = SamplingParams(**params_dict)
-    async for output in engine.generate(inputs=inputs, sampling_params=sampling_params, request_id="glm-4-9b"):
+    async for output in engine.generate(inputs=inputs, sampling_params=sampling_params, request_id=f"{time.time()}"):
        output_len = len(output.outputs[0].token_ids)
        input_len = len(output.prompt_token_ids)
        ret = {