본문 바로가기

분류 전체보기2809

smolagents로 로컬 AI 에이전트 오케스트레이션 자동화하기 LLM을 단순한 챗봇이 아니라 실제 업무를 수행하는 에이전트(Agent)로 만들고 싶다면, Hugging Face의 smolagents가 가장 가벼운 선택지입니다. 약 1,000줄의 코드로 이루어진 이 프레임워크는 로컬 LLM(Ollama)과 결합하여 코드 실행, 도구 호출, 다단계 추론까지 가능한 AI 에이전트를 몇 줄의 Python으로 구성할 수 있게 해줍니다. 이 글에서는 smolagents의 기본 구조부터 Ollama 로컬 모델을 연동한 실전 오케스트레이션 자동화 예제까지 살펴봅니다.개요smolagents는 Hugging Face가 Apache 2.0 라이선스로 공개한 경량 AI 에이전트 프레임워크입니다. 에이전트의 행동을 JSON이 아닌 Python 코드 조각으로 직접 생성·실행하는 Code A.. 2026. 6. 27.

pytesseract + OpenCV로 OCR 자동화 파이프라인 구축하기 (무제한 문서 처리) 개요OCR(Optical Character Recognition)은 이미지 속 텍스트를 추출하는 기술로, 스캔한 문서, 사진 속 글자, PDF 등을 디지털 텍스트로 변환할 때 사용됩니다. Tesseract OCR은 구글이 후원하는 오픈소스 OCR 엔진이며, pytesseract는 이를 파이썬에서 호출할 수 있게 해주는 래퍼(wrapper) 라이브러리입니다. 여기에 OpenCV로 전처리(그레이스케일, 이진화, 노이즈 제거 등)를 더하면 문서 품질이 낮아도 인식률을 극대화할 수 있습니다. 이 글에서는 Tesseract + pytesseract 설치부터 OpenCV 전처리를 포함한 완전한 OCR 자동화 파이프라인까지 단계별로 살펴봅니다.설치 (Installation)Tesseract OCR 엔진은 OS 패키지.. 2026. 6. 24.

ollama Python 라이브러리로 로컬 LLM 서빙 자동화하기 개요Ollama Python 라이브러리는 로컬 Ollama 서버를 파이썬 코드로 제어하는 공식 클라이언트다. 모델 내려받기, 채팅, 커스텀 모델 생성까지 스크립트 하나로 자동화 가능하다.기본 문법 / 주요 파라미터Modelfile 인스트럭션인스트럭션설명필수FROM기본 모델 지정필수PARAMETER추론 파라미터 설정 (temperature, num_ctx 등)선택SYSTEM시스템 메시지선택TEMPLATE전체 프롬프트 템플릿선택ADAPTER(Q)LoRA 어댑터 적용선택LICENSE라이선스 명시선택MESSAGE대화 히스토리 (few-shot)선택주요 PARAMETER파라미터설명기본값temperature창의성 제어 (높을수록 다양)0.8num_ctx컨텍스트 윈도우 크기(토큰)2048top_k상위 K개 토큰만 샘.. 2026. 6. 23.

Pydantic AI로 LLM 출력 구조화·타입검증 자동화하기 개요LLM의 출력은 기본적으로 문자열이라서, 실제 업무에 활용하려면 JSON 파싱 → 타입 검증 → 예외 처리의 반복 작업이 필요했습니다.Pydantic AI는 Pydantic의 타입 검증 엔진을 LLM 에이전트에 그대로 적용한 Python 프레임워크입니다. 에이전트의 출력 타입을 Pydantic 모델로 선언하면 LLM이 반환한 결과를 자동으로 검증하고, IDE 자동완성과 정적 타입 검사(MyPy/Pyright)까지 활용할 수 있습니다.FastAPI가 웹 개발에 가져온 "타입 안정성 혁명"을 GenAI 앱 개발에 그대로 옮겨온 느낌입니다.기본 문법 / 주요 파라미터pydantic-ai 설치 후 Agent 클래스가 핵심 인터페이스입니다.pip install pydantic-ai파라미터타입설명modelstr.. 2026. 6. 22.

aiocron + asyncio로 파이썬 비동기 작업 스케줄러 자동화하기 개요\n\n반복적인 예약 작업이 필요할 때 전통적으로는 유닉스 cron 데몬이나 schedule 같은 동기 라이브러리를 사용했습니다. 하지만 비동기(asyncio) 기반 애플리케이션에서는 이벤트 루프를 블로킹하지 않고 cron 작업을 실행하는 것이 중요합니다. aiocron은 asyncio 환경에서 cron 표현식으로 코루틴을 예약 실행할 수 있는 경량 라이브러리로, 데코레이터 한 줄로 주기적인 비동기 작업을 정의할 수 있어 코드가 간결해집니다.\n\nPython의 asyncio는 async/await 구문으로 동시성 코드를 작성하는 표준 라이브러리입니다(공식 문서). aiocron은 이 asyncio 위에서 cron 기반 스케줄링을 제공하며, 내부적으로 cronsim을 사용해 표준 cron 표현식을 파.. 2026. 6. 21.

duckdb.sql로 CSV·Parquet 파일 SQL 분석 자동화하기 개요DuckDB는 별도의 데이터베이스 서버 설치 없이 CSV, Parquet, JSON 파일을 곧바로 SQL로 조회하고 분석할 수 있는 경량 내장형 OLAP 데이터베이스입니다. .sql 파일에 쿼리를 작성하고 CLI에서 실행하면, 동일한 분석을 반복 가능한 스크립트로 만들어 자동화할 수 있어 데이터 파이프라인 구축에 매우 유용합니다.기본 문법 / 주요 파라미터DuckDB는 파일을 마치 테이블처럼 직접 쿼리할 수 있는 독특한 접근 방식을 제공합니다. 아래는 가장 핵심적인 명령어와 파라미터입니다. 명령어 / 함수 설명 예시 SELECT * FROM '파일경로' CSV, Parquet 등을 테이블처럼 직접 조회 (자동 타입 추론) .. 2026. 6. 20.

이전 1 2 3 4 ··· 469 다음

티스토리툴바