LCEL로 간단한 LLM Application 구축하기
https://python.langchain.com/docs/tutorials/llm_chain/
RAG로 졸업프로젝트를 진행했었는데, 깊이 없이 부랴부랴 개발했던 것 같아서 제대로 다시 공식문서부터 읽어보면서 공부하려고 한다.
LangChain외에도 LlamaIndex, Spring AI가 있는데 일단 대중적이고 한번 써본 LangChain부터 실습했다.
모든 실습은 VSCode, Jupyter Notebook을 통해 이뤄진다.
만들 app : 영어에서 다른 언어로 텍스트를 번역하는 애플리케이션
- 언어 모델 사용
- PromptTemplates 및 OutputParsers 사용
- LangChain Expression Language(LCEL)를 사용하여 컴포넌트 연결하기
- LangSmith를 사용한 애플리케이션 디버깅 및 추적
- LangServe로 배포하기
LangChain 설치하기
주피터 노트북 기반
%pip install langchain
LangSmith
LLM 애플리케이션 개발, 모니터링 및 테스트를 위한 플랫폼
LangChain으로 빌드하는 애플리케이션에서는 LLM을 여러번 호출한다. 애플리케이션이 점점 더 복잡해짐에 따라 chain이나 agent 내부에서 정확히 무슨 일이 일어나고 있는지 검사하기 위해 LangSmith를 활용할 수 있다.
LangSmith 사이트로 접속해서 회원가입
- Setting
- Personal
- Create API Key
- Personal Access Token
키 description은 임의로 설정한다.
생성된 키는 유출하지 않도록 안전한 곳에 복사한다.
#주피터 노트북에서 LangSmith 키 설정 방법
import getpass
import os
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_API_KEY"] = getpass.getpass()
키 설정은 vscode에서 할 경우 .env
파일을 사용하고 주피터노트북에선 getpass
를 활용한다. 런타임이 종료되면 매번 다시 api 키를 입력해줘야 한다는 번거로움이 있다.
언어 모델
LangChain에서 사용가능한 LLM은 다음과 같다.
- OpenAI
- Anthropic -> Claude
- Azure -> Azure OpenAI
- Cohere
- NVIDIA
- FireworksAI
- AWS
- Groq
- MistralAI
- TogetherAI
난 개인적으로 API 키가 있는 openai 모델을 사용했다.
openai api를 처음 사용하는 계정은 무료 토큰이 일정량, 일정 기간동안 제공되는 것으로 안다. 난 작년에 만들어두고 잊고 있다가 올해 보니까 무료 기간이 지나버려서 최소 금액 $5를 결제해서 사용 중인데 이정도만 돼도 해보고 싶은 실습은 웬만큼 다 해볼 수 있는 것 같다.
%pip install -qU langchain-openai
LangSmith 키와 마찬가지로 getpass를 사용한다.
import getpass
import os
os.environ["OPENAI_API_KEY"] = getpass.getpass()
from langchain_openai import ChatOpenAI
model = ChatOpenAI(model="gpt-4")
LLM 객체를 생성할 때, temperature
, model
값을 지정할 수 있다. temperature
는 0~1 값을 갖는데, 1에 가까울 수록 창의적인 답변이 만들어진다.
ChatModel
은 LangChain "Runnables"의 객체이다.
Runnable : Runnable 구성 요소가 다음과 같이 동작할 수 있도록 하는 표준 인터페이스를 정의한다.
stream
: 응답의 청크를 스트리밍 -> 실시간 출력.invoke
: 입력에 대해 체인 호출batch
: 입력 목록에 대해 체인 호출 -> 일괄 처리
단순히 모델을 호출하기 위해선 invoke
메서드에 메시지의 리스트를 전달하면 된다.
from langchain_core.messages import HumanMessage, SystemMessage
msgs = [
SystemMessage(content="You are a helpful assistant that translates English to Korean."),
HumanMessage(content="I love programming.")
]
model.invoke(msgs)
OutputParsers
AIMessage
는 모델의 응답으로, 방금 전 보았던 출력처럼 string과 응답에 대한 메타데이터를 포함한다. 우리가 문자열 형태로만 응답을 얻고 싶다면 출력 파서를 사용해야 한다.
- LLM의 출력을 받아 더 적합한 형식으로 변환
- 구조화된 데이터 생성에 매우 유용함
- LangChain 프레임워크에서 다양한 종류의 출력 데이터를 파싱하고 처리
주요 특징
다양성, 스트리밍 지원, 확장성
from langchain_core.output_parsers import StrOutputParser
parser = StrOutputParser()
result = model.invoke(msgs)
parser.invoke(result) # 출력 : 나는 프로그래밍을 사랑한다
Chain 생성
invoke할 때마다 parser를 사용하는 대신 |
을 사용해서 모델의 응답과 parser를 연결할 수 있다.
이 연결을 통해 chain을 호출할 때마다 우리가 선언한 출력 parser를 사용할 수 있게 된다.
chain = model | parser
chain.invoke(msgs)
Prompt Templates
프롬프트 템플릿은 사용자의 입력값을 언어 모델에 전달될 수 있는 형태로 포맷팅한다. 여기선 기본적인 chat 관련 템플릿인 ChatPromptTemplate
을 사용했다. 커스터마이징할 수도있는데, 이런 템플릿들은 LangChain Hub에 업로드돼있다. 도커 이미지 허브와 비슷하다.
from langchain_core.prompts import ChatPromptTemplate
system_template = "Translate the following into {language}:"
prompt_template = ChatPromptTemplate.from_messages(
[("system", system_template), ("user", "{text}")]
)
prompt_template
의 입력은 dictionary 형태이다. invoke하면 ChatPromptValue
를 반환하는데, 이때 SystemMessage content의 {language}가 korean이 된 걸 확인할 수 있다.
result = prompt_template.invoke({"language": "korean", "text": "hi"})
#ChatPromptValue 객체 반환
result
result.to_messages() #메시지에 직접 액세스
[SystemMessage(content='Translate the following into korean:', additional_kwargs={}, response_metadata={}),
HumanMessage(content='hi', additional_kwargs={}, response_metadata={})]
|
연산자를 사용해서 모델과 출력파서를 결합할 수 있다.
chain = prompt_template | model | parser
chain.invoke({"language": "korean", "text": "hi"})
LangServe로 모델 서빙하기
- 체인 정의
- FastAPI 앱
- langserve.add_routes에 chain을 서비스할 경로가 정의된다.
#!/usr/bin/env python
from dotenv import load_dotenv
from fastapi import FastAPI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_openai import ChatOpenAI
from langserve import add_routes
#API KEY
load_dotenv()
# 1. Create prompt template
system_template = "Translate the following into {language}:"
prompt_template = ChatPromptTemplate.from_messages([
('system', system_template),
('user', '{text}')
])
# 2. Create model
model = ChatOpenAI()
# 3. Create parser
parser = StrOutputParser()
# 4. Create chain
chain = prompt_template | model | parser
# 5. App definition
app = FastAPI(
title="LangChain Server",
version="1.0",
description="A simple API server using LangChain's Runnable interfaces",
)
# 6. Adding chain route
add_routes(
app,
chain,
path="/chain",
)
if __name__ == "__main__":
import uvicorn
uvicorn.run(app, host="localhost", port=8000)
LangServe는 간단한 UI를 가진 Playground를 제공한다. 서버를 실행하고 Inputs에 번역할 텍스트와 language를 입력하면 번역 결과가 나온다.
Streamlit으로도 대화형 UI 프론트엔드를 구현할 수 있다.
import streamlit as st
from langserve import RemoteRunnable
st.title('Simple LLM Translator')
language = st.text_input("Language:")
text = st.text_input("Text:")
if st.button('전송'):
remote_chain = RemoteRunnable("http://localhost:8000/chain/")
result = remote_chain.invoke({"language": language, "text": text})
st.write("응답:", result)