본문 바로가기
AI (GPT4, 로컬 LLM)

YouTube Data API 기반 요리 콘텐츠 자동 큐레이션 설계 노트

by 자루스 2026. 1. 30.

 

1. 문제 정의

 

YouTube에는 요리 영상이 과잉 공급되어 있다.

그러나 다음 조건을 동시에 만족하는 콘텐츠는 드물다.

 

  • 실제로 따라 할 수 있음
  • 설명란에 텍스트 레시피가 존재
  • 과도하게 복잡하지 않음
  • 어느 정도 **사회적 검증(조회수)**을 통과

 

문제는 단순 추천이 아니라

**“자동화로 어디까지 판단할 수 있는가”**였다.

 


 

2. 설계 범위 설정 (의도적 제한)

 

 

포함

 

  • YouTube Data API v3
  • search.list, videos.list
  • 제목, 설명란, 메타데이터 기반 판단

 

 

제외 (1차)

 

  • 조회수 성장률
  • 댓글 분석
  • 자막/음성 분석
  • DB 기반 재조회

 

이유:

👉 정적 데이터만으로도 설계 판단 연습이 가능하기 때문.

 


 

3. 검색 프로파일 분리

 

검색 조건을 코드에 직접 박지 않고

도메인 전용 프로파일로 분리했다.

 

 

cooking_simple_ko

 

기본 조건

 

  • language: ko
  • region: KR
  • type: video
  • order: viewCount

 

제목 필수 키워드 (OR)

 

  • 초간단 / 간단 / 쉬운 / 누구나 / 자취
  • 3분 / 5분 / 10분
  • 원팬 / 전자레인지 / 에어프라이어

 

제목 금지 키워드 (NOT)

 

  • 정통 / 장인 / 호텔 / 코스
  • 숙성 / 발효 / 수비드 / 저온
  • 셰프 / 오마카세 / 시그니처
  • 하루 / 이틀 / 3일 / 12시간

 

👉 이 단계에서 “쉬움”을 강제한다.

 


 

4. 하드 필터 전략

 

“좋은 요리”를 정의하지 않고

탈락 조건만 정의한다.

 

 

하드 필터 #1 (검색 직후)

 

  • 영상 길이 ≤ 10분
  • 조회수 ≥ 10,000
  • videoId 중복 제거
  • 제목 규칙 통과

 

 

하드 필터 #2 (상세 조회 후)

 

  • 설명란에 레시피 텍스트 존재
    • 재료 / 준비물
    • 만드는 법 / 조리 / 레시피
    • 계량 단위(g, ml, 큰술 등)
  •  
  • 링크만 있는 설명란 → 탈락

 

 

하드 필터 #3 (복잡성)

 

  • 재료·단계 과다
  • 특수 공정(숙성·발효 등)
  • 제목은 쉬운데 설명은 복잡한 경우

 


 

5. 검사 강도의 의도적 제한

 

Top10 후보만 필요하므로

정교한 점수 모델은 배제했다.

 

 

자동 검사 최소 세트

 

  • 중복
  • 길이
  • 조회수
  • 제목 규칙
  • 설명란 레시피 존재

 

 

제외

 

  • 성장률
  • 댓글 반응
  • 채널 신뢰도 점수화

 

이유:

👉 사람이 최종 선택할 것이기 때문.

 


 

6. 결과물 포맷 (DB 없이)

 

1차 결과는 JSON 파일 1개다.

 

포함:

 

  • 날짜
  • 사용한 검색 규칙
  • Top10 후보
  • 각 항목의 통과 이유

 

의도:

 

  • 재현 가능성
  • 나중에 DB로 이관 가능
  • 노코딩 도구 연계 가능

 


 

7. 중요한 설계 결정

 

 

조회수 관련 판단

 

  • 조회수 낮음 ≠ 나쁜 영상 (동의)
  • 그러나 성장률 판단은:
    • 스냅샷 저장 필요
    • 재조회 필요
    • DB 설계 필요
  •  

 

👉 프로토타입 범위 초과

→ 확장판으로 명확히 분리

 


 

8. 최종 구조 요약

 

  • 자동화: 후보 생성까지만
  • 판단: 하드룰 기반 제거
  • 선택: 사람(방문자)

 

이 시스템은 추천 엔진이 아니라

**“선별 가능한 후보를 정직하게 줄이는 엔진”**이다.

 


 

9. 설계 결론

 

이 프로젝트의 핵심 가치는 결과가 아니라

다음 질문에 답한 데 있다.

 

자동화로 할 수 있는 것과
하면 안 되는 것을 어디서 나눌 것인가?

 

요리는 내가 직접 검수할 수 있는 도메인이기 때문에

이 판단을 가장 빠르게 반복할 수 있었다.

 


 

기술적 한 줄 요약

 

이 설계는 ‘정확한 추천’을 만들지 않는다.
대신 ‘설명 가능한 선택’을 가능하게 한다.