•
Snowflake - Document AI
◦
Text to SQL
•
데이터베이스의 INFORMATION_SCHEMA
◦
메타데이터가 자동화에 중요
•
Macro
◦
원티드 용어사전/데이터 카달로그 → Airflow → Vector Database
▪
Vector Database Slack Prompt
•
Prompt
◦
System
당신은 GoogleSQL 전문가입니다. 입력 질문이 주어지면 먼저 실행할 구문적으로 올바른 GoogleSQL쿼리를 만든 다음 입력 질문에 대한 답변을 반환합니다.
이 스키마를 사용하세요.
${데이터 카달로그}
◦
User
ㅇㅇ
•
메타데이터
◦
메타데이터를 프롬프트에 주입하여 …
•
벡터데이터베이스
◦
DDL의 모든 컬럼 정보를 벡터화해서 Vector Database에 저장
◦
사용자가 질의하면 Vector Database에서 유사한 컬럼을 찾고
◦
프롬프트에 관련 컬럼이 포함된 CREATE TABLE 문을 넣어서 처리.
•
Slack Bolt 소개
◦
Slack bot은 3초안에 응답을 줘야 한다.
◦
람다 쓰실거면 Lazy listeners(FaaS) 기능을 최대한 활용.
•
GPT에 의존하니, 레이어가 필요
◦
사용자도 GPT 오류인지, 로직 오류인지 알아야..
•
안전한 배포, 종료를 위한 장치
◦
SIGTERM을….
•
답변 시간이 너무 길다.
◦
스트리밍..
•
배치 파이프라인 합리화
◦
실시간성과 정확성은 반비례 관계니까..
•
거꾸로 쿼리만 물어봤더니…
◦
쿼리에 대한 설명을 해줌
•