챗봇은 Alibaba Cloud의 최첨단 Model Studio API를 기반으로 하며 웹에서 스크랩한 데이터로 강화되어 정확한 최신 응답을 보장합니다. 이는 다음과 같이 설계되었습니다:
● 도메인 특화: 특정 범위 내에서 정보를 제공하도록 맞춤화하여 정보의 연관성을 보장합니다.
● 사용자 정의 가능: 모든 데이터 세트 또는 사용 사례에 쉽게 적용할 수 있습니다.
● 사용자 친화적: 원활한 상호작용을 위해 Gradio와 함께 배포됩니다.
이 블로그에서는 Alibaba Cloud Academy 인증 웹페이지를 사용하지만 원칙과 기술은 모든 도메인에 적용될 수 있습니다.
이 블로그에서는 웹사이트에서 직접 정보를 추출할 수 있는 웹 스크래핑을 사용합니다. 이 데이터는 챗봇의 지식 기반을 형성합니다. 간단한 Python 스크립트를 사용하여 텍스트 콘텐츠를 스크래핑하여 나중에 사용할 수 있도록 저장할 수 있습니다.
"target_url"을 원하는 웹사이트 URL로 바꾸기만 하면 됩니다. 이 파일을 실행하면 웹사이트의 데이터가 포함된 텍스트 파일이 생성됩니다.
추출된 데이터는 챗봇의 응답이 정확할 뿐만 아니라 온라인에서 제공되는 최신 정보와 관련이 있음을 보장합니다.
데이터가 준비되면 이제 Alibaba Cloud Model Studio와 통합할 차례입니다. Model Studio API는 자연어 이해를 가능하게 하는 하며, 프롬프트 엔지니어링으로 챗봇의 동작을 Fine-Tuning 합니다.
챗봇은 스크래핑된 데이터에 대한 구체적인 질문에 답하고 범위를 벗어난 질의는 정중하게 거부하도록 프로그래밍되어 있습니다. 예를 들어, Alibaba Cloud Academy Professional Certifications에 대한 질의만 처리하고 관련 없는 질문에는 미리 정의된 메시지로 응답합니다.
● 추론에 사용할 모델을 입력합니다. 본 예시에서는 qwen-max 모델 사용
response = dashscope.Generation.call("qwen-max",messages=messages,result_format='message',stream=False,incremental_output=False)
● 환경 변수 로딩: 파일에서 환경변수의 "api_key" 영역을 확인하세요. API 키는 Alibaba Model Studio 콘솔에서 얻을 수 있습니다.
알리바바클라우드 모델스튜디오의 Flashship 모델 소개
Gradio를 사용하면 챗봇이 간단한 대화형 웹 인터페이스에 배포됩니다. 이를 통해 사용자는 챗봇에 쉽게 액세스하고 상호 작용할 수 있어서 실제 어플리케이션 환경에 실용적으로 활용할 수 있습니다.
● 구동에 필요한 패키지를 IDE의 Environment에 설치하세요 (i.e. dashscope, dotenv, gradio)
● IDE에서 academygradio 서버를 실행하세요
# python academygradio.py
● chatbot의 학습 지식베이스에 질문을 던지세요. 지식베이스의 원문이 영어라도 한국어로 질의응답이 가능한 것을 보실 수 있습니다.
● 웹 스크래핑: 대상 웹사이트에서 필요한 데이터를 수집하여 로컬 파일에 저장합니다.
● 프롬프트 엔지니어링: 스크래핑된 데이터를 사용하여 챗봇의 응답을 안내하는 사용자 지정 템플릿을 만듭니다.
● 응답 생성: Model Studio API를 사용하여 사용자 쿼리를 처리하고 정확한 답변을 생성합니다.
● 사용자 상호 작용: 쉬운 액세스와 사용을 위한 Gradio 인터페이스를 제공합니다.
● 효율성: 웹 스크래핑으로 데이터 수집을 자동화하여 챗봇을 최신 상태로 유지합니다.
● 정밀도: Alibaba Cloud Model Studio로 프롬프트 엔지니어링을 사용하여 상황에 맞는 정확한 응답을 보장합니다.
● 유연성: 데이터 소스와 프롬프트를 수정하여 챗봇을 모든 도메인이나 산업에 맞게 조정합니다.
챗봇 디자인은 다재다능하며 다양한 산업에 적용할 수 있습니다.
● 전자상거래: 제품별 FAQ에 답변합니다.
● 고객 지원: 주소 및 연락처 번호와 같은 지점별 세부 정보를 제공합니다.
● 교육: 과정 정보 및 학업 관련 질문에 대한 지원을 제공합니다.
이 챗봇은 벡터 데이터베이스를 사용하지 않으며 입력 토큰 측면에서 제한적입니다. 따라서 웹사이트에 텍스트가 많으면 작동하지 않을 수 있습니다.
주의 사항으로, 사용자는 웹 스크래핑의 법적 측면을 고려해야 합니다. 특정 정보는 스크래핑이 제한되거나 금지될 수 있습니다.
Alibaba Cloud Model Studio와 결합된 웹 스크래핑은 개인화되고 도메인별 사용자 경험을 제공하는 챗봇을 구축하는 강력한 방법을 제공합니다. 고객 지원을 개선하거나, 정보 전달을 간소화하거나, 사용자 참여를 강화하려는 경우 이 접근 방식은 성공하는 데 필요한 도구를 제공합니다.
오늘 맞춤형 챗봇을 구축하고 대상 고객과 상호 작용하는 방식을 혁신하세요!
• https://www.alibabacloud.com/blog/601863
• https://www.alibabacloud.com/help/en/model-studio/getting-started/what-is-model-studio
Regional Content Hub - August 12, 2024
Regional Content Hub - May 20, 2024
JJ Lim - December 31, 2021
Junho Lee - June 15, 2023
Regional Content Hub - April 15, 2024
Haemi Kim - September 15, 2021
Top-performance foundation models from Alibaba Cloud
Learn MoreA one-stop generative AI platform to build intelligent applications that understand your business, based on Qwen model series such as Qwen-Max and other popular models
Learn MoreConduct large-scale data warehousing with MaxCompute
Learn MoreA dialogue platform that enables smart dialog (based on natural language processing) through a range of dialogue-enabling clients
Learn MoreMore Posts by James Lee