바이브 코딩/유튜브 자막 추출

AI 요약 기능을 넣어보자! #4

registry 2026. 2. 20. 22:17

이전 글

유튜브 자막 추출 사이트를 만들어 보자 #1

운영 첫날에 본 숫자들 #2

AI 요약 기능을 붙일지 말지 고민중이다 #3


이전 글에서 AI 요약 기능을 넣게 된다면 API를 쓰지 않고 오픈소스 모델을 다운받아서 미세조정을 통해 구현해보려고 했다.
결론부터 말하자면 API를 통해 구현하게 되었다. (세팅 복잡..)
내 컴퓨터에서 돌릴 수 있는 아주 작은 파라미터의 모델은 생각한 것 만큼 성능이 잘 나오지 않았고 미세조정은 숙력도가 부족해서 내가 제대로 했는지도 모르는 수준이다.
그래서 API를 통해 기능을 추가를 했다.

이제부터 AI 요약 기능을 적용한 과정에 대해 정리해보겠다

 

## 두 가지 선택지: 자체 모델 vs 외부 API

 

AI 요약 기능을 넣는 방법은 크게 두 가지였다.

  1. 오픈소스 모델을 내려받아 자체 서버에 띄우는 방법 (초기 비용이 크다)
  2. 빅테크 기업의 API를 사용하는 방법

나는 초기 비용과 운영 리스크를 최소화하고 싶었기 때문에,

오픈소스 모델 대신 API를 사용하는 쪽으로 방향을 잡았다.

 

---

 

## 주요 AI API 요금 비교

 

2026년 2월 기준으로, 텍스트 요약 용도에서 현실적으로 고려 가능한

저가형 모델들의 API 요금을 비교해봤다.

회사별 모델별 비용정리 - 회사 모델 입력 토큰 (1M당) 출력 토큰 (1M당)

Google Gemini 2.5 Flash-Lite $0.10 $0.40 가성비 좋음
Google Gemini 2.5 Flash $0.30 $2.50 속도 빠름, 품질 안정
OpenAI GPT-5 nano $0.05 $0.40 초저가, 품질은 제한적
OpenAI GPT-5 mini $0.25 $2.00 준수한 요약 품질
Anthropic Claude Haiku 4.5 $1.00 $5.00 문체 자연스러움
xAI Grok-4.1 Fast $0.20 $0.50 가성비 매우 좋음

이 중에서 내가 중요하게 본 기준은 딱 세 가지였다.

  • 요약 품질이 실사용에 충분한가
  • 토큰 단가가 낮은가 (별표 세 개!!!!!)
  • API 안정성과 문서가 괜찮은가

이 기준으로 보면,

Gemini 2.5 Flash-Lite가 거의 압도적인 선택지였다.

 

---

 

## 왜 Gemini를 선택했는가

 

Gemini 2.5 Flash-Lite는 요약 용도에서 딱 내가 원하던 포지션이었다.

  • 입력 1M 토큰당 $0.10
  • 출력 1M 토큰당 $0.40
  • 컨텍스트 1M 토큰
  • 요약, 분류, 단순 변환 작업에 충분한 품질

게다가 Google은 다른 회사들보다무료 티어가 매우 관대한 편이었다. (무료다!)

내가 실제로 사용하려던 모델 기준 무료 한도는 다음과 같았다.

  • Requests per day (RPD): 1,500
  • Requests per minute (RPM): 15
  • Tokens per minute (TPM): 250,000

이 정도면,

사이드 프로젝트에서 요약 기능을 붙이기에는 충분히 매력적인 조건이었다.

 

---

 

## Gemini 무료지만 한도가 있다! 악의적인 사용자가 있으면 어떡하지?! 

(DAU 0이다.. 쓸데없는 걱정이지만 그래도 걱정됨)

 

AI API는 구조적으로 사용량이 늘어날수록 비용이 그대로 증가한다.

  • 누군가가 봇을 붙여서 무한 호출하면? 
  • 악의적으로 대량 요청을 보내면?
  • 갑자기 트래픽이 터지면? 

이 모든 비용이 전부 내 카드로 청구된다.

 

---

 

## 그래서 선택한 방식: 사용자가 직접 API 키 입력

 

고민하다가 하나의 타협안을 떠올렸다.

Gemini는 개인 사용자도 무료 API 키를 발급받을 수 있다.

무료 티어 한도 안에서는 과금도 없다.

그래서 UX는 좀 나빠지지만, 구조를 이렇게 바꿨다.

  1. 사용자가 “AI 요약” 버튼을 누르면
  2. Google AI Studio에서
  3. 무료 API 키를 발급받는 방법을 안내하는 모달을 띄운다
  4. 사용자가 본인 API 키를 입력한다
  5. 그 키로 요약 요청을 실행한다

즉, 요약 비용을 서비스 운영자가 아니라 사용자 본인이 부담하는 구조다.

(무료 티어라서 사실상 0원)

 

---

 

## UX는 나빠졌지만, 이게 최선이었다

 

솔직히 말하면 UX는 확실히 나빠졌다.

(이거 귀찮아서 누가 쓰겠나.. 유저 입장에서 키 유출 걱정도 되겠다)

그런데도 이 방식을 선택한 이유는 단순하다.

 

사이드 프로젝트를 지속 가능하게 운영하려면 과금 폭탄 리스크를 0에 가깝게 만들어야 했고

기능을 아예 빼는 것보다는 불편하더라도 있는 게 낫다고 판단했다

 

(AI 요약 버튼을 누르면 이런 화면이 뜬다..)