AI 논문, 처음부터 끝까지 읽지말자
서론
대학원에 들어오면 논문을 읽어야 한다는 건 누구나 안다. 그런데 정작 “어떻게” 읽는지는 아무도 제대로 가르쳐주지 않는다. 그래서 많은 사람이 첫 문장부터 한 줄씩 정독하다가 서론(introduction)에서 지쳐버리고, 한 편을 다 못 끝낸 채 죄책감만 쌓는다.
결론부터 말하면, 논문은 책처럼 읽는 게 아니다. 특히 AI 분야는 더더욱 그렇다. 이 글에서는 박사과정을 앞두고 내가 정리한 AI 논문 읽기 방법을 공유한다. 막 시작하는 사람을 기준으로 썼지만, 읽는 양이 많은데 방식이 잡히지 않은 사람에게도 도움이 될 것이다.
1. 가장 먼저 깨야 할 오해
숙련된 연구자는 논문을 비선형적으로, 그리고 걸러내면서 읽는다. 모든 논문을 똑같은 깊이로 읽지 않는다. 어떤 건 1분 만에 덮고, 어떤 건 일주일을 붙잡는다.
이게 가능한 이유는 논문 읽기의 목적이 “다 읽기”가 아니라 “필요한 만큼만 정확히 이해하기”이기 때문이다. 읽어야 할 논문이 산더미인데 전부 정독하면 버틸 수가 없다. 그러니 거를 건 빨리 거르는 기술이 먼저다.
2. AI 분야는 좀 특수하다
본격적인 방법으로 들어가기 전에, AI 논문만의 특징을 짚고 가야 한다. 이걸 모르면 다른 분야의 독법을 그대로 가져와 헤매게 된다.
학술지가 아니라 학회와 프리프린트가 기본 단위다. AI에서는 NeurIPS, ICML, ICLR, CVPR, ACL 같은 학회(conference) 논문, 그리고 arXiv에 올라오는 프리프린트(preprint)가 중심이다. 정식 피어리뷰를 거치지 않은 글이 매일 수백 편씩 쏟아지고, 1~2년이면 내용이 낡는다.
그래서 결국 내가 직접 리뷰어가 되어야 한다. 이게 AI 논문 읽기의 핵심이다. 유명해 보이는 논문도 검증되지 않아 틀릴 수 있고, 반대로 학회 리뷰 과정에도 노이즈가 많다. “권위 있는 곳에 실렸으니 맞겠지”라는 태도는 통하지 않는다. 아래에서 이야기할 모든 것이 결국 이 한 문장으로 모인다 — 읽으면서 끊임없이 의심하라.
3. 세 번 훑기 (Three-Pass Method)
컴퓨터과학자 S. Keshav가 정리한 고전적인 방법인데, 거의 모든 분야에 통한다. 핵심은 한 번에 다 이해하려 하지 말고, 점점 깊이 들어가는 세 단계로 나누는 것이다.
첫 번째 패스 — “이걸 더 읽을 가치가 있나?” (5~10분)
제목, 초록(abstract), 서론, 각 섹션 제목, 결론만 읽는다. 목적은 단 하나, 계속 읽을지 말지 판단하는 것. 이 단계에서 상당수의 논문은 “지금 내게 필요 없음”으로 분류되어 덮인다. 그래도 괜찮다. 오히려 그게 정상이다.
두 번째 패스 — 핵심 흐름 잡기 (약 1시간)
본문을 읽되, 증명이나 세부 수식 유도는 일단 건너뛴다. 대신 그림(figure)과 표(table)를 유심히 본다. 잘 쓴 논문은 메인 그림 하나만 봐도 핵심 주장이 보인다. 모르는 용어는 표시만 해두고 전체 흐름을 놓치지 않는 게 중요하다.
세 번째 패스 — 깊게 파기 (필요할 때만)
내 연구와 직결되거나 반드시 완전히 이해해야 하는 논문만 여기까지 간다. 저자가 한 일을 내가 직접 재현한다고 상상하며, 모든 가정에 의문을 던지면서 읽는다. 모든 논문을 이 단계까지 끌고 갈 필요는 없다.
4. 다섯 가지 질문을 들고 읽어라
수동적으로 글자를 흡수하지 말고, 질문을 손에 들고 읽어야 한다. 논문을 펼칠 때마다 아래 다섯 가지를 의식적으로 답해보자.
- 무슨 문제를 푸는가?
- 왜 중요한가? (기존 연구의 어떤 빈틈을 메우나)
- 구체적으로 뭘 했는가? (방법)
- 그게 된다는 걸 어떻게 보였는가? (근거)
- 한계는 무엇인가?
특히 4번과 5번 — 근거를 평가하고 한계를 짚는 비판적 읽기가 바로 대학원생급 역량이다. “이해했다”에서 멈추지 말고 “이게 정말 설득력 있나?”까지 가야 한다.
5. 진짜 알맹이는 어디에 있나
AI 논문은 구조가 꽤 표준화되어 있다.
Abstract → Intro → Related Work → Method → Experiments → Ablation → Conclusion → Appendix
핵심 아이디어는 보통 method 섹션 + 메인 그림 하나(아키텍처 다이어그램이나 알고리즘 박스)에 압축되어 있다. 그리고 대부분의 논문은 “기존 X에 Y를 더했다” 한두 문장으로 줄일 수 있다. 그 한 문장을 뽑아내는 연습을 의식적으로 하자.
그런데 초보자가 꼭 건너뛰는 두 곳에 진짜 알맹이가 숨어 있다.
Ablation study. 논문이 트릭을 다섯 개 제안한다면, ablation은 그중 무엇이 실제로 효과를 냈는지 알려준다. 나머지는 들러리인 경우가 많다. 이걸 읽어내는 것이 ML에서 비판적 읽기의 핵심이다.
Appendix(부록). 진짜 하이퍼파라미터, 학습 디테일, 사용한 연산량, 실패 사례가 다 여기 있다. 본문은 잘 포장되어 있지만, 진실은 부록에 있다.
6. 비판적으로 읽기 = 실험을 의심하기
AI에서 “이게 정말 설득력 있나?”라는 질문은 거의 전적으로 실험 평가에 달려 있다. 결과 표를 볼 때 다음을 따져보자.
- 베이스라인이 공정한가? 자기 방법은 튜닝을 잘 해놓고 비교 대상은 대충 돌리는 게 가장 흔한 수법이다.
- 같은 조건의 비교인가? 연산량·데이터·파라미터 수를 맞췄나, 아니면 그냥 더 큰 모델로 이긴 건가. 성능 향상이 제안한 아이디어 덕분인지, 그저 compute와 데이터를 더 부어서인지가 핵심 질문이다.
- 시드를 여러 개 돌렸나? error bar가 있나? ML은 재현성 위기가 심하다. 한 번 돌린 SOTA는 그냥 노이즈일 수 있다.
- 무엇과 비교하지 않았고, 어떤 데이터셋에서 테스트하지 않았나? 눈에 띄는 공백에 약점이 숨어 있다.
- 정성적 예시가 체리피킹은 아닌가? 테스트셋 오염(leakage)은 없나?
참고로 abstract과 intro는 “we achieve SOTA” 식으로 인상을 극대화하도록 쓰여 있다. 거기 적힌 주장은 항상 실험 표로 직접 확인하는 습관을 들이자.
7. 코드가 논문의 절반이다
이건 AI만의 큰 특징이다. 대부분의 논문에는 GitHub 저장소가 딸려 있다. 그리고 종종 method 섹션의 수식보다 코드 50줄이 훨씬 명확하다.
AI에서 논문을 “이해했다”의 진짜 기준은 핵심 방법을 직접 구현할 수 있는가이다. 처음에는 유명한 논문 한두 편을 골라 핵심 모듈을 직접 짜보길 권한다. The Annotated Transformer처럼 코드와 해설을 한 줄씩 붙여놓은 자료부터 시작하면 좋다.
8. 도구와 커뮤니티
혼자 맨몸으로 읽지 말고 도구의 도움을 받자.
- Papers With Code — 벤치마크와 코드를 연결해준다.
- Connected Papers, Semantic Scholar — 인용 관계로 분야의 지도를 그릴 수 있다.
- 저자 발표 영상 — 많은 논문이 학회 토크나 YouTube 해설을 함께 제공한다.
- 레퍼런스 매니저(Zotero, Mendeley 등) — 지금부터 습관을 들이자. 논문 한 편당 “한 문단 요약 + 핵심 기여 + 내 의문점”을 남기면, 나중에 글쓰기와 연구의 자산이 된다.
그리고 AI에는 독특한 문화가 하나 있다. X(트위터)에서 논문이 실시간으로 토론되고 반박된다. 분야의 핵심 인물 몇 명만 팔로우해도, 어떤 논문이 화제이고 어디가 까이는지 감이 빠르게 잡힌다.
9. 일찍 읽어두면 좋은 논문들
세부 분야가 무엇이든, 어디서나 인용되어 “공용 어휘”가 된 논문들이 있다. 이것들을 일찍 읽어두면 이후가 훨씬 편하다.
- Attention Is All You Need — Transformer
- ResNet — 잔차 연결(residual connection)
- BERT / GPT 계열 — 사전학습(pre-training) 패러다임
- Adam — 옵티마이저
어떤 세부 분야로 가든 이 이름들은 계속 마주치게 된다.
10. 마지막으로 — 느린 건 정상이다
처음에는 논문 한 편에 몇 시간씩 걸려도 완전히 정상이다. 속도는 “빨리 읽는 능력”이 아니라 배경지식이 쌓이면서 붙는다. 초보 때 느린 진짜 이유는 모르는 게 많아서지, 읽기 능력 자체의 문제가 아니다.
그러니 처음 느린 건 걱정하지 말자. 거를 건 빨리 거르고, 남길 건 깊이 파고, 늘 리뷰어의 눈으로 의심하면서 읽는 것 — 이 습관만 들이면 속도는 자연스럽게 따라온다.
한 줄 요약: AI 논문은 처음부터 끝까지 읽는 게 아니다. 걸러내고, 의심하고, 구현해보면서 읽어라.