GitHub Actions + Gemini로 콘텐츠 자동화 파이프라인 구축하기

콘텐츠 재활용을 손으로 하면 시간이 그대로 증발합니다.

블로그 글 1개를 LinkedIn, Twitter/X, 뉴스레터로 바꾸는 데 평균 2~3시간. 주 2회 발행이면 한 달에 24시간이 복붙에 날아갑니다. 그 시간은 제품 개발에 써야 합니다.

이 글은 실제로 돌아가는 자동화 파이프라인을 만드는 방법을 정리한 것입니다. GitHub Actions + Google Gemini API를 조합해 블로그 글을 Git에 푸시하면 3개 채널용 콘텐츠가 자동 생성되도록 만드는 시스템입니다.

아키텍처 개요

[블로그 MD 파일 푸시]
        ↓
[GitHub Actions 트리거]
        ↓
[Python 스크립트: 원문 파싱]
        ↓
[Gemini API: 3가지 버전 생성]
   ├── LinkedIn 포스트 (200-300자)
   ├── Twitter/X 스레드 (5-8개 트윗)
   └── 뉴스레터 섹션 (500-700자)
        ↓
[결과물을 PR 코멘트로 첨부]

겉보기엔 단순하지만 단계마다 함정이 있습니다. 하나씩 짚어봅니다.

1단계: GitHub Actions 워크플로우 설정

# .github/workflows/content-repurpose.yml
name: Content Repurposer

on:
  push:
    paths:
      - 'blog/**/*.md'
      - 'docs/**/*.md'

jobs:
  repurpose:
    runs-on: ubuntu-latest
    
    steps:
      - uses: actions/checkout@v4
        with:
          fetch-depth: 2  # diff 비교용
      
      - name: Get changed files
        id: changed-files
        run: |
          git diff --name-only HEAD~1 HEAD -- '*.md' > changed.txt
          cat changed.txt
      
      - name: Set up Python
        uses: actions/setup-python@v5
        with:
          python-version: '3.12'
      
      - name: Install dependencies
        run: pip install google-generativeai python-frontmatter
      
      - name: Run repurposer
        env:
          GEMINI_API_KEY: ${{ secrets.GEMINI_API_KEY }}
          GITHUB_TOKEN: ${{ secrets.GITHUB_TOKEN }}
        run: python scripts/repurpose.py changed.txt

fetch-depth: 2가 핵심입니다. 기본값 1로 두면 이전 커밋이 없어 git diff가 실패합니다. 그러면 변경 파일 목록이 비어 파이프라인이 빈손으로 끝납니다.

2단계: Gemini 프롬프트 설계

“LinkedIn 포스트로 바꿔줘” 수준의 지시는 결과가 들쭉날쭉합니다. 플랫폼 제약을 무시하기 때문입니다.

실제로 쓰는 프롬프트 구조는 아래와 같습니다:

import google.generativeai as genai
import frontmatter

def repurpose_content(md_path: str, platform: str) -> str:
    with open(md_path) as f:
        post = frontmatter.load(f)
    
    title = post.metadata.get('title', '')
    body = post.content[:3000]  # 토큰 제한 고려
    
    prompts = {
        'linkedin': f"""
당신은 B2B 테크 콘텐츠 전문가입니다.

원문 블로그 포스트:
제목: {title}
내용: {body}

LinkedIn 포스트를 작성하세요:
- 첫 줄이 훅이어야 함 (스크롤 멈추게)
- 200-300자 (한국어 기준)
- 3-5개의 핵심 인사이트를 번호 리스트로
- 끝에 질문형 CTA
- 해시태그 5개
- 이모지 적절히 사용 (과하지 않게)
""",
        'twitter': f"""
당신은 테크 트위터 전문가입니다.

원문 블로그 포스트:
제목: {title}
내용: {body}

Twitter 스레드를 작성하세요:
- 1/n 형식으로 5-7개 트윗
- 첫 트윗이 가장 강렬한 주장
- 각 트윗 280자 이하 (영어 기준 — 한국어는 140자 기준)
- 마지막 트윗에 원문 링크 플레이스홀더: [LINK]
- 리트윗 유도하는 마무리
""",
        'newsletter': f"""
당신은 뉴스레터 편집자입니다.

원문 블로그 포스트:
제목: {title}
내용: {body}

뉴스레터 섹션을 작성하세요:
- 500-700자 (한국어 기준)
- 독자가 이미 뉴스레터를 구독 중이라는 가정
- 핵심 3가지만 추출
- 원문으로 연결되는 자연스러운 CTA
- 형식: 소제목 + 본문 + CTA
"""
    }
    
    model = genai.GenerativeModel('gemini-2.0-flash')
    response = model.generate_content(prompts[platform])
    return response.text

핵심은 플랫폼별 글자 수 제한을 명시하는 것입니다. “짧게 써줘”는 잘 안 먹히고, “200-300자”는 잘 먹힙니다.

3단계: 결과물 PR 코멘트 첨부

GitHub Actions에서 바로 Slack이나 이메일로 보내는 것보다 PR 코멘트에 붙이는 방식이 더 낫습니다.

이유는 단순합니다:

검토 후 수정 가능
히스토리 추적 가능
추가 설정 불필요

import os
import subprocess
from github import Github

def post_to_pr(content: dict, md_path: str):
    g = Github(os.environ['GITHUB_TOKEN'])
    repo = g.get_repo(os.environ['GITHUB_REPOSITORY'])
    
    # 현재 커밋의 PR 찾기
    sha = subprocess.check_output(
        ['git', 'rev-parse', 'HEAD']
    ).decode().strip()
    
    pulls = repo.get_pulls(state='open')
    for pr in pulls:
        if pr.head.sha == sha:
            comment = format_comment(content, md_path)
            pr.create_issue_comment(comment)
            break

def format_comment(content: dict, source: str) -> str:
    return f"""## 🔄 Content Repurposer 결과

**원문:** `{source}`

### LinkedIn
{content['linkedin']}

---

### Twitter 스레드
{content['twitter']}

---

### 뉴스레터
{content['newsletter']}

---
*by [Content Repurposer](https://github.com/p4r4d0xb0x/content-repurposer)*
"""

4단계: 실전에서 자주 터지는 문제

Gemini API 레이트 리밋

Flash 모델 무료 티어는 분당 15 요청. 파일 3개 × 플랫폼 3개 = 9 요청이면 여유 있지만, 여러 파일이 동시에 푸시되면 터집니다.

해결책: 각 요청 사이에 time.sleep(4) 추가. 우아하진 않지만 안정적입니다.

import time

for platform in ['linkedin', 'twitter', 'newsletter']:
    result[platform] = repurpose_content(md_path, platform)
    time.sleep(4)  # 레이트 리밋 방지

마크다운 frontmatter 파싱 오류

python-frontmatter가 일부 특수문자 제목에서 파싱 실패합니다. 방어 코드가 필요합니다:

try:
    post = frontmatter.load(f)
    title = post.metadata.get('title', '')
except Exception:
    # 폴백: 첫 줄에서 제목 추출
    f.seek(0)
    for line in f:
        if line.startswith('# '):
            title = line[2:].strip()
            break

콘텐츠 길이 초과

Gemini가 가끔 요청보다 훨씬 긴 결과를 냅니다. LinkedIn 포스트인데 800자가 나오는 경우도 있습니다.

프롬프트 제약 + 결과 후처리를 함께 씁니다:

def trim_to_limit(text: str, limit: int) -> str:
    if len(text) <= limit:
        return text
    # 문장 단위로 자르기
    sentences = text.split('.')
    result = ''
    for s in sentences:
        if len(result) + len(s) + 1 <= limit:
            result += s + '.'
        else:
            break
    return result.strip()

실제 성능 수치

이 파이프라인을 2주간 운영한 결과:

항목	수동	자동화
처리 시간	2-3시간/포스트	45초/포스트
비용	인건비	Gemini Flash $0.002/포스트
품질	일정	80% 이상 즉시 사용 가능
일관성	사람에 따라 다름	프롬프트 기반 일관성 유지

“80% 즉시 사용 가능”이 핵심입니다. 100%를 목표로 하면 프롬프트 튜닝에 무한정 시간을 씁니다. 80%에서 사람이 20%를 다듬는 게 현실적이고 빠릅니다.

이걸 SaaS로 만들면?

직접 구축하면 장점이 있습니다. 완전한 커스터마이즈, 내 인프라, API 키 직접 관리.

단점도 분명합니다. 초기 설정 4~6시간, 에러 디버깅을 혼자 해결, 플랫폼별 프롬프트를 계속 튜닝.

그래서 Content Repurposer를 만들었습니다. 위의 복잡함을 CLI 한 줄로 압축:

repurpose post.md --platforms linkedin,twitter,newsletter

설정 없음. API 키 발급도 필요 없음. 3월 8일 오픈소스 + 유료 티어 동시 런칭.

직접 구축하든, 도구를 쓰든 — 콘텐츠 재활용 자동화는 지금 당장 시작해야 합니다. 매주 낭비되는 시간을 아무도 돌려주지 않습니다.

아키텍처 개요​

1단계: GitHub Actions 워크플로우 설정​

2단계: Gemini 프롬프트 설계​

3단계: 결과물 PR 코멘트 첨부​

4단계: 실전에서 자주 터지는 문제​

Gemini API 레이트 리밋​

마크다운 frontmatter 파싱 오류​

콘텐츠 길이 초과​

실제 성능 수치​

이걸 SaaS로 만들면?​