반응형 분류 전체보기2787 faster-whisper로 CPU 전용 유튜브·틱톡 자막 자동화하기 개요이 글에서는 CPU 환경에서 faster-whisper를 사용해 유튜브·틱톡 동영상의 자막(.srt/.vtt)을 자동으로 생성하는 워크플로를 소개합니다. Whisper 계열의 로컬 서버(whisper.cpp, EasyDeL)와 호환되는 API 개념을 바탕으로, 음성 추출 → 로컬 모델로 전사 → 자막 포맷 변환의 실전 예제를 다룹니다. GPU가 없거나 클라우드를 쓰기 어려운 환경에 특히 유용합니다.기본 문법 / 주요 파라미터 파라미터설명기본값 / 예시 model / --model사용할 Whisper 모델 파일(또는 모델 이름). 모델 크기(예: tiny, base, small, medium, large)를 선택해 정확도와 속도 균형 결정large-v2, ggml-large-v2... 2026. 5. 21. accelerate.launch로 Mistral/대형 모델 분산 배포 자동화하기 개요accelerate.launch는 Hugging Face의 accelerate 툴체인에서 제공하는 실행 진입점으로, 멀티-GPU/멀티머신 환경에서 추가 코드 변경 없이 PyTorch 기반 학습·추론을 분산해서 실행하도록 도와줍니다. pytorch-accelerated 같은 경량 트레이너는 내부적으로 accelerate를 활용해 장치 배치, mixed-precision, DeepSpeed 연동 등을 간단히 처리할 수 있어 대형 모델(예: Mistral 계열) 분산 배포에 특히 유용합니다.기본 문법 / 주요 파라미터 파라미터 / 옵션설명 accelerate launch 분산 환경에서 실행할 파이썬 스크립트 호출 (기본 문법) --num_processes / --num_proce.. 2026. 5. 20. git --author로 깃허브 스팸 커밋 자동 차단 스크립트 만들기 개요git --author는 커밋 작성자를 수동으로 지정할 때 쓰는 Git 옵션입니다. 이 값을 이용해 의심스러운 커밋(예: 자동화된 스팸 커밋)을 탐지하고, 로컬 훅이나 GitHub API로 자동 대응(푸시 차단 또는 이슈/리버트 생성)하는 스크립트를 만들면 저장소 무결성을 지키는 데 유용합니다.기본 문법 / 주요 파라미터 항목설명예시 git commit --author커밋의 author 정보를 수동으로 설정 (이름과 이메일)git commit --author="Spam Bot " -m "..." git log --format로그의 출력 포맷 지정 (author, email, hash 등)git log --format='%H;%an;%ae;%s' pre-push 훅로컬에.. 2026. 5. 19. rabin fingerprint로 콘텐츠 기반 청킹(CDC) 파이썬 자동화하기 개요콘텐츠 기반 청킹(Content-Defined Chunking, CDC)은 파일/스트림을 내용(데이터 패턴)에 따라 잘라서 중복 제거(deduplication), 동기화, 증분 백업에 적합한 방법입니다. 그중 Rabin fingerprint는 위치 독립적인 경계(즉, 삽입/삭제가 있어도 많은 청크 경계가 보존됨)를 만들어줘 CDC에서 널리 사용됩니다. 이 글에서는 파이썬으로 Rabin 기반 CDC를 간단히 구현하고 실제 자동화 예시를 제공합니다.기본 문법 / 주요 파라미터 파라미터설명타입권장값/기본값 polynomialRabin fingerprint에 사용할 생성 다항식(비트 폴리노미얼). 경계 특성에 영향.int (비트마스크)0x3DA3358B4DC173 (예시) / 구현별 다.. 2026. 5. 17. onnxruntime.InferenceSession으로 엣지 장치에 모델 배포 자동화하기 개요ONNX Runtime은 다양한 프레임워크에서 변환한 ONNX 모델을 엣지(Edge) 장치에서 빠르게 실행하도록 돕는 경량의 추론 엔진입니다. 여기서는 Python API 중 onnxruntime.InferenceSession을 중심으로 설치 요구사항, 핵심 파라미터와 함께 간단한 사용법 및 실전 자동화 예제를 소개합니다. 또한 MMDeploy/MMCV 관련 커스텀 연산자 빌드와 런타임 설치 팁을 정리합니다.기본 문법 / 주요 파라미터파라미터설명model_path로컬 ONNX 모델 파일(.onnx) 경로sess_optionsonnxruntime.SessionOptions 인스턴스로 최적화 레벨, 스레드 수 등을 설정providers사용할 실행 제공자 목록('CPUExecutionProvider', '.. 2026. 5. 16. urllib.robotparser로 robots.txt 준수 크롤러 자동화하기 개요urllib.robotparser는 표준 라이브러리에서 제공하는 robots.txt 파서를 쉽게 다루도록 해 주는 도구입니다. 웹 크롤러가 사이트의 크롤링 규칙(허용/차단, Crawl-delay 등)을 확인해 안전하게 접근하도록 자동화할 때 유용합니다. 별도 의존성 없이 Python만으로 robots.txt 규칙을 검사할 수 있습니다.기본 문법 / 주요 파라미터 메서드/속성시그니처설명 RobotFileParserRobotFileParser(url='')robots.txt URL을 다룰 파서 객체를 만듭니다. 생성자에 URL을 넘기거나 set_url로 설정합니다. set_urlset_url(url)파서가 읽을 robots.txt의 URL을 설정합니다. readread().. 2026. 5. 15. 이전 1 2 3 4 ··· 465 다음 반응형