glm4/composite_demo/src/conversation.py

167 lines
7.3 KiB
Python
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

import json
import re
from dataclasses import dataclass
from datetime import datetime
from enum import Enum, auto
import streamlit as st
from streamlit.delta_generator import DeltaGenerator
from PIL.Image import Image
from tools.browser import Quote, quotes
QUOTE_REGEX = re.compile(r"【(\d+)†(.+?)】")
SELFCOG_PROMPT = "你是一个名为 GLM-4 的人工智能助手。你是基于智谱AI训练的语言模型 GLM-4 模型开发的,你的任务是针对用户的问题和要求提供适当的答复和支持。"
DATE_PROMPT = "当前日期: %Y-%m-%d"
TOOL_SYSTEM_PROMPTS = {
"python": "当你向 `python` 发送包含 Python 代码的消息时,该代码将会在一个有状态的 Jupyter notebook 环境中执行。\n`python` 返回代码执行的输出,或在执行 60 秒后返回超时。\n`/mnt/data` 将会持久化存储你的文件。在此会话中,`python` 无法访问互联网。不要使用 `python` 进行任何网络请求或者在线 API 调用,这些在线内容的访问将不会成功。",
"simple_browser": "你可以使用 `simple_browser` 工具。该工具支持以下函数:\n`search(query: str, recency_days: int)`:使用搜索引擎进行查询并显示结果,可以使用 `recency_days` 参数控制搜索内容的时效性。\n`mclick(ids: list[int])`:获取一系列指定 id 的页面内容。每次调用时须选择3-10个页面。选择多个角度的页面同时尽可能选择可信任的信息来源。考虑到部分页面是无法加载的你也可以多打开一些可能有用的页面而不用担心内容过多。\n`open_url(url: str)`:打开指定的 URL。\n\n使用 `【{引用 id}†{引用文本}】` 来引用内容。\n\n操作步骤1. 使用 `search` 来获得信息列表; 2. 使用 `mclick` 来获取指定 ID 页面的内容; 3. 根据获得的内容进行回复。在回复中应当引用信息来源。\n 如果用户提供了 URL也可以用 `open_url` 直接打开页面。\n如果初次搜索结果没有找到合适的信息,也可以再次使用 `search` 进行搜索。",
"cogview": "如果用户的请求中包含了对图像的描述,你可以使用 `cogview` 来生成图像并展示给用户。你需要向 `cogview` 发送图像描述,规则:\n- 发送给 `cogview` 的消息必须使用英语。用户的中文描述必须完全翻译为英语。\n- 应当尽可能详细地描述图像生成的需求,需求描述约 100 英文单词。\n- 保持用户原始描述的意图。不要虚构内容或者没见过的人物。\n- 如无特殊说明,所在地为中国,持有中国立场并遵循中国社会主义价值观。",
}
FILE_TEMPLATE = "[File Name]\n{file_name}\n[File Content]\n{file_content}"
def build_system_prompt(
enabled_tools: list[str],
functions: list[dict],
):
value = SELFCOG_PROMPT
value += "\n\n" + datetime.now().strftime(DATE_PROMPT)
if enabled_tools or functions:
value += "\n\n# 可用工具"
contents = []
for tool in enabled_tools:
contents.append(f"\n\n## {tool}\n\n{TOOL_SYSTEM_PROMPTS[tool]}")
for function in functions:
content = f"\n\n## {function['name']}\n\n{json.dumps(function, ensure_ascii=False, indent=4)}"
content += "\n在调用上述函数时,请使用 Json 格式表示调用的参数。"
contents.append(content)
value += "".join(contents)
return value
def response_to_str(response: str | dict[str, str]) -> str:
"""
Convert response to string.
"""
if isinstance(response, dict):
return response.get("name", "") + response.get("content", "")
return response
class Role(Enum):
SYSTEM = auto()
USER = auto()
ASSISTANT = auto()
TOOL = auto()
OBSERVATION = auto()
def __str__(self):
match self:
case Role.SYSTEM:
return "<|system|>"
case Role.USER:
return "<|user|>"
case Role.ASSISTANT | Role.TOOL:
return "<|assistant|>"
case Role.OBSERVATION:
return "<|observation|>"
# Get the message block for the given role
def get_message(self):
# Compare by value here, because the enum object in the session state
# is not the same as the enum cases here, due to streamlit's rerunning
# behavior.
match self.value:
case Role.SYSTEM.value:
return
case Role.USER.value:
return st.chat_message(name="user", avatar="user")
case Role.ASSISTANT.value:
return st.chat_message(name="assistant", avatar="assistant")
case Role.TOOL.value:
return st.chat_message(name="tool", avatar="assistant")
case Role.OBSERVATION.value:
return st.chat_message(name="observation", avatar="assistant")
case _:
st.error(f"Unexpected role: {self}")
@dataclass
class Conversation:
role: Role
content: str | dict
# Processed content
saved_content: str | None = None
metadata: str | None = None
image: str | Image | None = None
def __str__(self) -> str:
metadata_str = self.metadata if self.metadata else ""
return f"{self.role}{metadata_str}\n{self.content}"
# Human readable format
def get_text(self) -> str:
text = self.saved_content or self.content
match self.role.value:
case Role.TOOL.value:
text = f"Calling tool `{self.metadata}`:\n\n```python\n{text}\n```"
case Role.OBSERVATION.value:
text = f"```python\n{text}\n```"
return text
# Display as a markdown block
def show(self, placeholder: DeltaGenerator | None = None) -> str:
if placeholder:
message = placeholder
else:
message = self.role.get_message()
if self.image:
message.image(self.image, width=512)
if self.role == Role.OBSERVATION:
metadata_str = f"from {self.metadata}" if self.metadata else ""
message = message.expander(f"Observation {metadata_str}")
text = self.get_text()
if self.role != Role.USER:
show_text = text
else:
splitted = text.split('files uploaded.\n')
if len(splitted) == 1:
show_text = text
else:
# Show expander for document content
doc = splitted[0]
show_text = splitted[-1]
expander = message.expander(f'File Content')
expander.markdown(doc)
message.markdown(show_text)
def postprocess_text(text: str, replace_quote: bool) -> str:
text = text.replace("\(", "$")
text = text.replace("\)", "$")
text = text.replace("\[", "$$")
text = text.replace("\]", "$$")
text = text.replace("<|assistant|>", "")
text = text.replace("<|observation|>", "")
text = text.replace("<|system|>", "")
text = text.replace("<|user|>", "")
text = text.replace("<|endoftext|>", "")
# Replace quotes
if replace_quote:
for match in QUOTE_REGEX.finditer(text):
quote_id = match.group(1)
quote = quotes.get(quote_id, Quote("未找到引用内容", ""))
text = text.replace(
match.group(0), f" (来源:[{quote.title}]({quote.url})) "
)
return text.strip()