재무제표, 이제 AI와 함께 읽어요 — DART·EDGAR부터 LLM 분석 워크플로우까지

10분 읽기
AI와 함께 재무제표 분석하기
Google AdSense — 728×90
사업보고서 한 권이 수백 페이지라 매번 펼치다 덮으셨다면, 이번 글이 도움이 될 거예요. 공시 시스템에서 PDF를 받아 LLM(거대 언어 모델)에 올리는 실전 워크플로우를 처음부터 끝까지 정리했어요.

들어가며 — 왜 지금 LLM과 함께 읽어야 할까

종목 하나만 제대로 들여다보려고 해도 사업보고서·10-K·분기보고서가 수백 페이지 분량이에요. 개인 투자자가 이 분량을 다 읽는 건 현실적으로 어렵죠. 그래서 시장은 흔히 요약 기사증권사 리포트에 의존해왔습니다.

LLM이 PDF를 직접 읽고 답할 수 있게 되면서 상황이 달라졌어요. 본문을 통째로 넣고 내가 궁금한 질문을 던질 수 있게 된 거죠. 다만 LLM도 환각(hallucination)을 일으킬 수 있으니, 출처 페이지를 함께 요구하는 습관이 중요해요. 이 글은 그 워크플로우를 단계별로 안내해 드릴게요.

1. 한국 기업: DART에서 사업보고서 PDF 받기

DART(전자공시시스템)는 금융감독원이 운영하는 공식 채널이에요. URL은 dart.fss.or.kr.

단계별 절차

  1. DART 접속 — 브라우저에서 dart.fss.or.kr로 이동해요.
  2. 회사명 검색 — 상단 검색창에 회사명 또는 종목코드를 입력합니다. 예: "삼성전자".
  3. 공시 유형 필터링 — 좌측 메뉴에서 정기공시를 클릭하고, 보고서 유형(사업보고서/반기보고서/분기보고서)을 선택해요.
  4. 연도 선택 — 원하는 기간(예: 2025-01-01 ~ 2025-12-31)을 지정한 후 조회.
  5. 보고서 클릭 — 목록에서 해당 보고서 행의 제목을 누르면 본문 뷰어가 열려요.
  6. PDF 다운로드 — 뷰어 상단의 다운로드 또는 인쇄(PDF로 저장) 버튼을 사용합니다. 첨부문서 탭에서 재무제표 별첨 파일도 함께 받아두면 좋아요.

받아두면 좋은 파일 4종

  • 사업보고서 본문 (PDF)
  • 감사보고서 (별첨, 외부감사인 의견)
  • 연결재무제표 / 별도재무제표 (엑셀로 받을 수 있는 경우 분석이 더 편리)
  • 주석 (Notes) — 회계처리·세부 거래 내역이 담긴 핵심 부분

2. 미국 기업: SEC EDGAR에서 10-K 받기

SEC(미 증권거래위원회)의 EDGAR는 미국 상장사 공시의 공식 저장소예요. URL은 sec.gov/edgar.

단계별 절차

  1. EDGAR 접속sec.gov/edgar/search (EDGAR Full-Text Search) 또는 sec.gov/cgi-bin/browse-edgar로 이동.
  2. 회사 검색 — 회사명(예: "Apple Inc.") 또는 티커(예: "AAPL")로 검색해요.
  3. 회사 페이지 진입 — 검색 결과에서 회사명을 클릭하면 모든 공시 내역이 시간 역순으로 나옵니다.
  4. 필터 적용 — 상단의 Filing type 박스에 다음을 입력해서 좁혀요.
    • 10-K — 연차 보고서 (가장 상세, 한 해 1회)
    • 10-Q — 분기 보고서 (한 해 3회)
    • 8-K — 수시 공시 (M&A, 경영진 변동 등)
    • DEF 14A — 주주총회 위임장 (임원 보수·지배구조 정보)
  5. 해당 공시 클릭 — 우측의 Documents 버튼을 눌러요.
  6. 파일 다운로드10-k.htm(HTML 원본)과 PDF 변환본 둘 다 받을 수 있어요. PDF가 안 보이면 HTML 파일을 브라우저에서 열고 `인쇄 → PDF로 저장`으로 직접 변환합니다.

  • EDGAR는 연결재무제표를 별도 XBRL 파일로도 제공해요(Financial Report 링크). 숫자만 빠르게 비교하고 싶을 때 유용합니다.
  • 영문 보고서의 부담을 덜고 싶다면, LLM에 "이 10-K의 Risk Factors 섹션을 한국어로 정리해줘"라고 요청하면 됩니다.

3. LLM 분석 워크플로우 — 받은 PDF를 똑똑하게 다루는 법

LLM에 PDF를 업로드하는 방식은 모델마다 조금씩 다르지만, 공통 원칙은 비슷해요.

단계별 권장 절차

  1. 모델 선택 — Claude, ChatGPT(파일 업로드 지원 플랜), Gemini 등 PDF를 직접 받아 읽을 수 있는 모델을 사용합니다.
  2. 시스템 지시문 설정 — 대화 시작 시 분석 관점을 명시해요. 예시: "당신은 신중한 재무 분석가입니다. 답변은 PDF 안의 구체적 수치와 페이지 번호를 인용해 주세요. 본문에서 확인되지 않는 정보는 '근거 부족'이라고 답하세요."
  3. 파일 업로드 — 사업보고서 PDF를 첨부합니다. 큰 파일은 챕터별로 나눠 올리면 모델이 더 정확하게 답할 가능성이 있어요.
  4. 요약부터 시작 — 첫 질문은 "이 보고서의 사업 구조·매출 구성·주요 리스크를 800자 이내로 요약해줘" 같은 범위 잡기가 좋아요.
  5. 세부 질문으로 좁히기 — 요약을 보고 더 파고들 영역을 정해 추가 질문을 던집니다.
  6. 출처 검증 — 답변 안의 수치는 반드시 PDF 원문 페이지에서 직접 재확인하세요. LLM이 페이지 번호와 함께 답하더라도, 실제 위치가 맞는지 한 번씩 짚는 습관이 중요해요.
  7. 비교 분석 의뢰 — 동일 산업 다른 회사의 PDF를 같은 대화에 추가로 올려 "두 회사를 핵심 지표로 비교해줘"라고 요청하면 더 입체적인 시야를 얻을 수 있습니다.

자주 빠지는 함정

  • 숫자 환각 — LLM이 그럴듯한 수치를 만들어낼 수 있어요. 단위(억/조/달러/USD/KRW)와 회계 연도 표기를 꼭 재확인.
  • 요약 누락 — 긴 문서를 한 번에 요약하면 리스크 요인 같은 핵심 섹션이 빠지기 쉬워요. 섹션별로 따로 질문하세요.
  • 시점 혼동 — 보고서 기준일과 발표일을 구분하지 못하면 비교가 어긋납니다. 첫 질문에서 "보고서 기준일과 회계기간을 알려줘"부터 확정.

4. LLM에 던질 핵심 질문 7가지

분석할 회사가 정해졌다면, 아래 질문들을 순서대로 던져보세요. 각 질문은 재무 건전성·수익성·리스크 중 어느 축을 보는지도 함께 적어두었어요.

  1. [수익성] 최근 3~5년간 매출·영업이익·순이익 추이를 표로 정리해주세요. 전년 대비 증감률도 함께 표시해주세요. → 성장 추세가 가속·둔화·역성장 중 어느 국면인지 한눈에 보입니다.
  2. [재무 안정성] 부채비율, 유동비율, 자기자본비율을 최근 3년치로 알려주고 동종업계 평균과 비교해주세요. → 단기 지급능력과 자본 구조의 건전성을 확인.
  3. [회계 품질] 영업현금흐름과 영업이익을 같은 기간으로 비교했을 때 차이가 큰가요? 차이의 원인은 무엇인가요? → 두 수치가 장기적으로 크게 벌어지면 이익의 질을 의심해볼 만한 신호일 가능성이 있어요.
  4. [자본 효율성] ROE(자기자본이익률)와 ROIC(투하자본이익률) 5년 추이를 보여주고, 산업 평균 대비 어느 정도인지 평가해주세요. → 회사가 자본을 얼마나 효율적으로 굴리는지 알 수 있어요.
  5. [사업 구조] 사업 부문별 매출 비중과 영업이익 기여도를 표로 정리해주세요. 특정 부문에 매출이 과도하게 집중돼 있나요? → 한 부문 의존도가 높으면 그 산업 사이클이 곧 회사 운명이 됩니다.
  6. [리스크] 사업보고서 "사업의 내용"·"위험관리" 섹션에서 회사가 직접 명시한 주요 리스크 5가지를 알려주세요. 전년 보고서와 비교해 새로 추가되거나 강조점이 바뀐 리스크가 있나요? → 경영진이 스스로 인지한 위험의 변화는 강력한 신호일 가능성이 있어요.
  7. [자본 배분] 최근 3년간 배당 지급·자사주 매입·CapEx(설비투자)·M&A 지출 규모를 정리하고, 경영진의 자본 배분 우선순위를 평가해주세요. → 같은 이익이라도 어디에 쓰는지가 장기 주주 가치에 결정적입니다.

추가로 "이 회사의 가장 큰 강점 3개와 약점 3개를 본문에서 직접 인용하면서 정리해줘" 같은 종합 질문을 마지막에 던지면, 분석 흐름이 자연스럽게 마무리돼요.

5. 재무제표 외에 함께 보면 좋은 자료들

재무제표는 이미 지난 분기까지의 결과예요. 앞을 보려면 보조 자료가 함께 필요합니다.

회사 직접 자료

  • IR 페이지 — 회사 홈페이지의 "투자정보" 또는 "Investor Relations" 섹션. 분기 실적 발표 자료(IR Presentation)와 콘퍼런스콜 녹취록(transcript)이 핵심.
  • 컨퍼런스콜 — 경영진이 분기마다 분석가와 Q&A를 진행해요. 미국 기업은 Seeking AlphaMotley Fool에서 transcript 검색 가능.
  • 주주총회 자료 — 한국은 DART의 "주주총회소집결의", 미국은 DEF 14A 위임장.

산업·시장 자료

  • 증권사 리포트한경컨센서스, 네이버 증권 리서치 탭에서 무료로 다수 열람 가능.
  • 산업 협회 통계 — 반도체(SEMI), 자동차(KAMA·OICA), 화학(석화협회) 등 산업별 단체가 분기 통계를 발표.
  • 거시 데이터 — 한국은행 ECOS, 통계청 KOSIS, 미국 FRED. 금리·환율·고용 등 기업 실적의 배경 변수.

뉴스·소셜

  • 뉴스 RSS — 회사명 + 산업 키워드 RSS를 구독하면 실시간 흐름 파악이 쉬워요.
  • DART 알림 서비스 — 관심 기업을 등록해두면 새 공시가 올라올 때 이메일 알림이 와요.
  • SEC RSS — EDGAR의 회사 페이지 하단에서 RSS URL을 받아 피드 리더로 추적 가능.
  • 글래스도어(Glassdoor) / 잡플래닛 — 직원 리뷰는 기업 문화·경영진 평가의 비공식 신호.

비교·스크리닝 도구

  • Stockrover, Simply Wall St — 동종업계 비교를 시각화.
  • Naver 증권 / Yahoo Finance — 무료 기본 지표 비교에 충분.

마무리 — LLM은 읽기 도우미, 판단은 결국 내 몫

LLM은 수백 페이지 보고서의 읽기 시간을 압축해주는 강력한 도구예요. 하지만 LLM의 답변을 그대로 매수·매도 근거로 삼는 건 위험합니다. 다음 두 가지를 꼭 기억해주세요.

  • 모든 수치는 원문 페이지에서 직접 확인. LLM은 자신감 있게 틀린 숫자를 말할 수 있어요.
  • LLM의 해석은 하나의 시각. 회계는 추정과 가정이 많은 영역이라, 같은 데이터로 다른 결론이 나올 수 있습니다.

오늘 안내한 DART → PDF → LLM → 핵심 질문의 흐름을 관심 종목 한 개에만이라도 적용해보세요. 한 시간이면 회사 한 곳의 윤곽이 잡혀요. 그 경험이 쌓이면, 시장이 흔들릴 때도 본인 판단의 근거를 갖고 움직일 수 있게 됩니다.

ℹ️

본 글은 정보 제공 목적이며 투자 권유가 아닙니다. 모든 투자 판단과 그 결과에 대한 책임은 투자자 본인에게 있습니다.

공유트위터
📬 무료 뉴스레터
이런 리뷰, 매주 받아보고 싶다면?
매주 AI 도구·SaaS 실전 인사이트를 이메일로
구독하기