langchain-chat-with-milvus/document_ai/server.py

import os
from concurrent import futures

import langchain
import openai

import proto.document_query_pb2
import proto.document_query_pb2_grpc
import grpc
import proto.documents_pb2
import init
import doc_client
# from langchain.llms.openai import OpenAI
# from langchain.schema.document import Document
# from langchain.embeddings import OpenAIEmbeddings
# from langchain.chains.qa_with_sources import load_qa_with_sources_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.cache import InMemoryCache

langchain.llm_cache = InMemoryCache()

CHUNK_SIZE = 500

# openai.api_base = "https://api.openai.com/v1"
# openai.api_key="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"

class AIServer(proto.document_query_pb2_grpc.DocumentQuery):
    def Query(self, target,
              options=(),
              channel_credentials=None,
              call_credentials=None,
              insecure=False,
              compression=None,
              wait_for_ready=None,
              timeout=None,
              metadata=None):

        print("新的请求：" + target.question)
        vec = init.text_to_vector(target.question)

        question = target.question

        search_param = {
            "data": [vec],
            "anns_field": "vector",
            "param": {"metric_type": "L2"},
            "limit": 5,
            "expr": "user_id == " + str(target.user_id) + " && library_id == " + str(target.library_id),
            "output_fields": ["document_id", "user_id", "library_id"],
        }

        res = init.collection.search(**search_param)

        document_text = ""
        # real_document = []
        sources = []

        for i in range(len(res[0])):
            _chunk_id = res[0][i].id
            print("正在获取分块 " + str(_chunk_id) + " 的内容...")

            try:
                _chunk_content = doc_client.stub.GetDocumentChunk(proto.documents_pb2.GetDocumentChunkByIdRequest(
                    id=_chunk_id
                ))

                # print(_chunk_content)

                # _doc_content_full = _chunk_content.content
                document_text += "\n" + _chunk_content.content + "\n"

                # append
                sources.append({
                    "text": _chunk_content.content,
                    "document_id": _chunk_content.document.id,
                    "title": _chunk_content.document.title
                })

                # doc_obj = Document(page_content=_doc_content_full, metadata={"source": "chunked content"})

                # real_document.append(doc_obj)

            except Exception as e:
                print(e)

        print("正在调用 LLM...")

        output = search(document_text, question)

        print(sources)
        print("完成。")
        return proto.document_query_pb2.QueryResponse(
            text=output,
            sources=sources
        )

    def Chunk(self,
              target,
              options=(),
              channel_credentials=None,
              call_credentials=None,
              insecure=False,
              compression=None,
              wait_for_ready=None,
              timeout=None,
              metadata=None):

        text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=CHUNK_SIZE,
            chunk_overlap=20,
            length_function=len,
            add_start_index=True,
        )

        page_contents = text_splitter.create_documents([
            target.text
        ])

        texts = []

        for page_content in page_contents:
            texts.append(page_content.page_content)

        return proto.document_query_pb2.ChunkResponse(
            texts=texts
        )


def serve():
    _ADDR = os.getenv("BIND")
    if _ADDR is None:
        _ADDR = "[::]:50051"
    print("Listening on", _ADDR)

    server = grpc.server(futures.ThreadPoolExecutor(max_workers=10))
    proto.document_query_pb2_grpc.add_DocumentQueryServicer_to_server(AIServer(), server)

    server.add_insecure_port(_ADDR)
    server.start()
    server.wait_for_termination()


def search(summaries: str, question: str) -> str:
    prompt = f"""
使用以下文档回答问题，使用Markdown回答你得用“你”的身份指代用户。如果你不知道答案，你可以说你不知道，不要编造答案。总是使用中文回复。

QUESTION: {question}

===文档开始===
{summaries}
===文档结束===

FINAL ANSWER:
"""

    messages = [
        {
            "role": "user",
            "content": prompt
        }
    ]

    print(prompt)

    result = openai.ChatCompletion.create(
        messages=messages, model="gpt-3.5-turbo", temperature=0
    )
    res = result["choices"][0]["message"].to_dict_recursive()
    print(res)
    return res["content"]


if __name__ == '__main__':
    serve()
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
+								import os
 								from concurrent import futures
-												更改 依赖项目

											
										
										
											2023-11-15 14:24:03 +00:00
 								import langchain
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								import openai
-												更改 依赖项目

											
										
										
											2023-11-15 14:24:03 +00:00
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								import proto.document_query_pb2
 								import proto.document_query_pb2_grpc
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
+								import grpc
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								import proto.documents_pb2
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
+								import init
 								import doc_client
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								# from langchain.llms.openai import OpenAI
 								# from langchain.schema.document import Document
 								# from langchain.embeddings import OpenAIEmbeddings
 								# from langchain.chains.qa_with_sources import load_qa_with_sources_chain
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								from langchain.text_splitter import RecursiveCharacterTextSplitter
-												更改 依赖项目

											
										
										
											2023-11-15 14:24:03 +00:00
+								from langchain.cache import InMemoryCache
 								langchain.llm_cache = InMemoryCache()
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								CHUNK_SIZE = 500
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								# openai.api_base = "https://api.openai.com/v1"
 								# openai.api_key="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"
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
 								class AIServer(proto.document_query_pb2_grpc.DocumentQuery):
 								    def Query(self, target,
 								              options=(),
 								              channel_credentials=None,
 								              call_credentials=None,
 								              insecure=False,
 								              compression=None,
 								              wait_for_ready=None,
 								              timeout=None,
 								              metadata=None):
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								        print("新的请求：" + target.question)
 								        vec = init.text_to_vector(target.question)
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								        question = target.question
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
 								        search_param = {
 								            "data": [vec],
 								            "anns_field": "vector",
 								            "param": {"metric_type": "L2"},
-												改进

											
										
										
											2023-11-19 12:54:12 +00:00
+								            "limit": 5,
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								            "expr": "user_id == " + str(target.user_id) + " && library_id == " + str(target.library_id),
 								            "output_fields": ["document_id", "user_id", "library_id"],
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
+								        }
 								        res = init.collection.search(**search_param)
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								        document_text = ""
 								        # real_document = []
 								        sources = []
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
 								        for i in range(len(res[0])):
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								            _chunk_id = res[0][i].id
 								            print("正在获取分块 " + str(_chunk_id) + " 的内容...")
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
 								            try:
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								                _chunk_content = doc_client.stub.GetDocumentChunk(proto.documents_pb2.GetDocumentChunkByIdRequest(
 								                    id=_chunk_id
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
+								                ))
-												改进 输出结果

											
										
										
											2023-11-22 03:15:38 +00:00
+								                # print(_chunk_content)
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
 								                # _doc_content_full = _chunk_content.content
 								                document_text += "\n" + _chunk_content.content + "\n"
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								                # append
 								                sources.append({
 								                    "text": _chunk_content.content,
-												改进 输出结果

											
										
										
											2023-11-22 03:15:38 +00:00
+								                    "document_id": _chunk_content.document.id,
 								                    "title": _chunk_content.document.title
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								                })
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								                # doc_obj = Document(page_content=_doc_content_full, metadata={"source": "chunked content"})
 								                # real_document.append(doc_obj)
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
 								            except Exception as e:
 								                print(e)
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								        print("正在调用 LLM...")
-												更改 依赖项目

											
										
										
											2023-11-15 14:24:03 +00:00
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								        output = search(document_text, question)
-												更改 依赖项目

											
										
										
											2023-11-15 14:24:03 +00:00
-												改进 输出结果

											
										
										
											2023-11-22 03:15:38 +00:00
+								        print(sources)
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								        print("完成。")
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								        return proto.document_query_pb2.QueryResponse(
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								            text=output,
 								            sources=sources
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								        )
-												更改 依赖项目

											
										
										
											2023-11-15 14:24:03 +00:00
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								    def Chunk(self,
 								              target,
 								              options=(),
 								              channel_credentials=None,
 								              call_credentials=None,
 								              insecure=False,
 								              compression=None,
 								              wait_for_ready=None,
 								              timeout=None,
 								              metadata=None):
 								        text_splitter = RecursiveCharacterTextSplitter(
 								            chunk_size=CHUNK_SIZE,
 								            chunk_overlap=20,
 								            length_function=len,
 								            add_start_index=True,
 								        )
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								        page_contents = text_splitter.create_documents([
 								            target.text
 								        ])
-												更改 依赖项目

											
										
										
											2023-11-15 14:24:03 +00:00
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								        texts = []
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								        for page_content in page_contents:
 								            texts.append(page_content.page_content)
 								        return proto.document_query_pb2.ChunkResponse(
 								            texts=texts
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
+								        )
 								def serve():
 								    _ADDR = os.getenv("BIND")
 								    if _ADDR is None:
 								        _ADDR = "[::]:50051"
 								    print("Listening on", _ADDR)
 								    server = grpc.server(futures.ThreadPoolExecutor(max_workers=10))
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								    proto.document_query_pb2_grpc.add_DocumentQueryServicer_to_server(AIServer(), server)
-												add document ai

											
										
										
											2023-11-15 08:20:30 +00:00
+								    server.add_insecure_port(_ADDR)
 								    server.start()
 								    server.wait_for_termination()
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
-												改进 GPT 处理和回复

											
										
										
											2023-11-22 02:13:58 +00:00
+								def search(summaries: str, question: str) -> str:
 								    prompt = f"""
 								使用以下文档回答问题，使用Markdown回答你得用“你”的身份指代用户。如果你不知道答案，你可以说你不知道，不要编造答案。总是使用中文回复。
 								QUESTION: {question}
 								===文档开始===
 								{summaries}
 								===文档结束===
 								FINAL ANSWER:
 								"""
 								    messages = [
 								        {
 								            "role": "user",
 								            "content": prompt
 								        }
 								    ]
 								    print(prompt)
 								    result = openai.ChatCompletion.create(
 								        messages=messages, model="gpt-3.5-turbo", temperature=0
 								    )
 								    res = result["choices"][0]["message"].to_dict_recursive()
 								    print(res)
 								    return res["content"]
-												update

											
										
										
											2023-11-18 15:08:22 +00:00
+								if __name__ == '__main__':
 								    serve()