2장. 프로세서: 단일 코어에서 AI 두뇌까지
2007년 초대 아이폰의 심장은 삼성이 제조한 412MHz 단일 코어 프로세서였습니다. 한 번에 하나의 작업만 겨우 처리할 수 있었고, 웹 페이지 하나를 여는 데도 수 초가 걸렸습니다. 2024년, 퀄컴 스냅드래곤 8 엘리트의 NPU는 초당 75조 회의 AI 연산(75 TOPS)을 수행합니다. 412MHz에서 75 TOPS까지, 18년 사이에 프로세서는 단순한 연산 장치에서 인공지능의 두뇌로 변모했습니다.
이 변화의 과정을 이해하려면 프로세서가 단지 '빨라진' 것이 아니라 근본적으로 '다른 존재'가 되었다는 사실을 인식해야 합니다. 초기에는 CPU, GPU, 모뎀이 각각 별도의 칩으로 존재했습니다. 이것들이 하나의 SoC(System on Chip)로 통합되면서 전력 효율이 비약적으로 향상되었고, 단일 코어에서 big.LITTLE 멀티코어 구조로 진화하면서 성능과 배터리 수명의 균형을 찾았습니다. 그리고 지금, NPU라는 전용 AI 칩이 SoC의 핵심 구성 요소로 자리 잡으면서 스마트폰은 주머니 속 AI 컴퓨터가 되었습니다.
프로세서 전쟁에서 애플과 삼성의 전략 차이는 극명합니다. 애플은 2010년 A4 칩부터 완전한 자체 설계 노선을 걸었습니다. 2013년에는 업계의 의구심을 무릅쓰고 모바일 최초로 64비트 아키텍처(A7)를 도입했고, 이 판단은 결국 경쟁사 전체가 1~2년 안에 뒤따르게 만들었습니다. 반면 삼성은 자체 설계 Exynos와 퀄컴 스냅드래곤을 병행하는 이중 전략을 택했습니다. 자체 파운드리까지 보유한 삼성은 설계부터 제조까지 수직 계열화를 추구했지만, TSMC의 압도적 수율 앞에서 파운드리 경쟁은 쉽지 않은 도전이 되고 있습니다.
프로세서를 평가하는 기준 자체도 세대마다 바뀌어 왔습니다. 처음에는 클럭 속도(MHz)가 전부였습니다. 멀티코어 시대가 오자 코어 수와 벤치마크 점수가 마케팅의 중심이 되었고, 이후에는 제조 공정의 미세화(nm)가 핵심 경쟁력으로 부상했습니다. 10nm에서 7nm, 5nm, 3nm으로 줄어드는 공정 숫자는 원자 수준의 물리적 한계에 도전하는 과정이었습니다. 그리고 2023년부터 새로운 지표가 등장했습니다. TOPS(Tera Operations Per Second), 즉 NPU의 AI 연산 능력입니다. 클럭 속도로 시작해 TOPS로 도착한 이 여정은, 스마트폰이 무엇을 위한 기기인지에 대한 정의 자체가 바뀌었음을 보여줍니다.
이 장에서는 프로세서의 네 세대를 순서대로 따라가며, 손 안의 작은 칩이 어떻게 오늘날의 AI 두뇌가 되었는지 그 궤적을 추적합니다.
1세대 — 단일 코어와 독립 칩 (2007~2011)
2007년, 스티브 잡스가 무대에서 꺼내든 아이폰 1세대에는 삼성이 제조한 412MHz 단일 코어 프로세서가 들어 있었습니다. 오늘날 기준으로는 믿기 어려운 수치입니다. 이 프로세서는 한 번에 하나의 작업만 처리할 수 있었고, 멀티태스킹이라는 개념 자체가 존재하지 않았습니다.
칩 분리의 한계
이 시기의 가장 큰 구조적 한계는 칩의 분리였습니다. CPU, GPU, 모뎀이 각각 별도의 칩으로 존재했습니다. 세 개의 칩이 기판 위에서 따로 놓여 있으니, 데이터가 이동할 때마다 물리적 거리를 넘어야 했습니다. 거리가 멀면 전력을 더 소모하고, 열이 더 발생합니다. 초기 스마트폰이 쉽게 뜨거워지고 배터리가 빨리 닳았던 이유가 여기에 있습니다.
그럼에도 이 세대는 중요한 시작점이었습니다. 손 안의 기기가 컴퓨터처럼 작동할 수 있다는 가능성을 처음으로 보여주었기 때문입니다.
2세대 — SoC 통합과 멀티코어 (2012~2017)
1세대의 가장 큰 문제, 즉 칩이 흩어져 있다는 문제를 해결한 것이 SoC(System on Chip) 개념입니다.
SoC란? CPU, GPU, 모뎀, ISP(이미지 신호 처리기)를 하나의 칩 안에 통합한 것입니다. 마치 도시의 주요 기관을 한 건물에 모아놓은 것과 비슷합니다. 부품 간 데이터 이동 거리가 극적으로 줄어들었고, 전력 효율이 크게 향상되었습니다.
64비트의 전환점
애플이 2013년 A7 칩에서 모바일 최초로 64비트 아키텍처를 도입한 것이 이 시기의 전환점입니다. 당시 업계의 반응은 "스마트폰에 64비트가 왜 필요한가"였지만, 애플은 이것이 미래의 기반이 될 것임을 알고 있었습니다. 64비트 아키텍처는 더 많은 메모리를 효율적으로 활용할 수 있게 해주었고, 경쟁사들은 1~2년 안에 모두 뒤따라야 했습니다.
big.LITTLE 아키텍처
멀티코어 구조도 이 시기에 자리를 잡았습니다. ARM의 big.LITTLE 아키텍처가 대표적입니다.
| 코어 유형 | 역할 | 사용 시나리오 |
|---|---|---|
| big (고성능) | 무거운 작업 처리 | 게임, 영상 편집, AR |
| LITTLE (저전력) | 가벼운 작업 처리 | 메시지, 음악 재생, 대기 |
모든 코어가 항상 전력을 소모하는 대신, 필요한 만큼만 깨워서 쓰는 방식입니다. 이 구조가 스마트폰의 배터리 효율을 근본적으로 개선했습니다.
벤치마크의 한계
벤치마크 점수 경쟁이 본격화된 것도 이 시기입니다. 그러나 시간이 지나면서 벤치마크 점수와 실제 체감 성능 사이에 괴리가 있다는 인식이 생겨났습니다.
중요한 것은 순간 최고 속도가 아니라 지속 성능(Sustained Performance) 입니다. 벤치마크 점수가 높아도 5분 만에 뜨거워지는 프로세서보다, 점수가 조금 낮더라도 30분 동안 일정한 성능을 유지하는 프로세서가 실제로는 더 나은 선택입니다.
애플 vs 삼성: SoC 전략
| 구분 | 애플 (Apple) | 삼성 (Samsung) |
|---|---|---|
| SoC 설계 | 완전 자체 설계 (A 시리즈) | 자체 설계 (Exynos) + 퀄컴 (Snapdragon) 병행 |
| 핵심 차별점 | 64비트 선도, 단일 코어 성능 최강 | 멀티코어 스펙 경쟁, 자체 파운드리 보유 |
| GPU | 자체 설계 GPU | Mali (ARM) → Xclipse (AMD 협력) |
| 모뎀 | 퀄컴 모뎀 사용 → 자체 개발 추진 | 자체 모뎀 (Exynos Modem) 보유 |
3세대 — 미세 공정 경쟁 (2018~2022)
SoC 구조가 표준이 된 이후, 프로세서 경쟁의 무대는 제조 공정으로 옮겨갔습니다. 제조 공정이란 칩 안에 트랜지스터를 얼마나 작게 새길 수 있는가를 나타내는 수치입니다.
미세화의 원리
트랜지스터가 작아지면 두 가지가 동시에 일어납니다. 전력 소모가 줄고, 성능이 올라갑니다. 전자가 이동하는 거리가 짧아지기 때문입니다. 이것이 스마트폰 프로세서가 해마다 더 빨라지면서도 배터리 소모는 줄어드는 원리입니다.
| 공정 | 시기 | 트랜지스터 밀도 | 대표 칩 |
|---|---|---|---|
| 10nm | 2017 | ~48M/mm² | A11 Bionic, Exynos 8895 |
| 7nm | 2018 | ~96M/mm² | A12 Bionic, Snapdragon 855 |
| 5nm | 2020 | ~171M/mm² | A14 Bionic, Snapdragon 888 |
| 4nm | 2022 | ~200M/mm² | A16 Bionic, Snapdragon 8 Gen 2 |
| 3nm | 2023 | ~290M/mm² | A17 Pro, Exynos 2400 |
물리적 한계: 원자 수준에 가까워질수록 양자 효과로 인한 전류 누설이 발생하고, 수율(정상 칩 비율)이 떨어집니다. TSMC, 삼성 파운드리 사이의 경쟁은 이 물리적 한계를 누가 먼저 극복하느냐의 싸움이기도 합니다.
메모리와 저장장치의 동반 진화
프로세서와 함께 메모리와 저장 장치도 진화했습니다. 이 세 가지는 서로 맞물려 작동하기 때문에, 하나만 빨라서는 체감 성능이 오르지 않습니다.
| 구분 | 이전 세대 | 현재 세대 | 개선 효과 |
|---|---|---|---|
| 메모리 | LPDDR4 | LPDDR5X | 대역폭 2배 이상 향상 |
| 저장장치 | eMMC / UFS 3.1 | UFS 4.0 (4,200MB/s) | 앱 설치·파일 전송 속도 대폭 향상 |
파운드리 경쟁 구도
| 파운드리 | 주요 고객 | 강점 |
|---|---|---|
| TSMC | 애플, 퀄컴, AMD | 수율 안정성, 최첨단 공정 선도 |
| 삼성 파운드리 | 삼성 (Exynos), 퀄컴 (일부) | 수직 계열화, GAA 트랜지스터 선도 |
4세대 — NPU와 온디바이스 AI (2023~현재)
가장 최근의 전환이자 가장 근본적인 변화입니다. 프로세서의 핵심 전장이 CPU와 GPU에서 NPU(Neural Processing Unit, 인공지능 연산장치) 로 옮겨갔습니다.
NPU가 필요한 이유
AI 모델은 대부분 행렬 곱셈으로 작동합니다. 수만 개의 숫자를 동시에 곱하고 더하는 연산을 반복하는 것입니다.
| 프로세서 | AI 연산 효율 | 전력 소모 | 적합성 |
|---|---|---|---|
| CPU | 낮음 (범용 설계) | 높음 | 부적합 |
| GPU | 중간 (병렬 처리 가능) | 높음 | 보조적 |
| NPU | 높음 (행렬 연산 전용) | 낮음 | 최적 |
온디바이스 AI의 혁명
NPU의 등장이 가져온 가장 중요한 변화는 온디바이스 AI입니다.
| 구분 | 클라우드 AI (이전) | 온디바이스 AI (현재) |
|---|---|---|
| 처리 위치 | 외부 서버 | 기기 내부 |
| 네트워크 | 필수 | 불필요 |
| 응답 속도 | 지연 있음 | 즉각적 |
| 개인정보 | 서버 경유 | 기기 밖으로 나가지 않음 |
실제 활용 사례
| 제조사 | 기능 | 설명 |
|---|---|---|
| 삼성 Galaxy AI | 실시간 통화 번역 | 한국어↔영어 통화가 기기 내에서 실시간 번역 |
| 애플 Apple Intelligence | 이메일 자동 요약 | 긴 메일을 열어보지 않아도 핵심 내용 파악 |
| 구글 Pixel | 매직 지우개 | 사진 속 원치 않는 객체를 AI가 자연스럽게 제거 |
애플 vs 삼성: AI 프로세서 비교
| 구분 | 애플 (Apple) | 삼성 (Samsung) |
|---|---|---|
| NPU 명칭 | Neural Engine | NPU (Exynos) |
| NPU 성능 | A18 Pro: 35 TOPS | Exynos 2400: 34.4 TOPS |
| AI 브랜드 | Apple Intelligence | Galaxy AI |
| 접근 방식 | 온디바이스 우선 + 프라이버시 강조 | 온디바이스 + 클라우드 하이브리드 |
| 강점 | 하드웨어-소프트웨어 통합 최적화 | 다양한 AI 기능 빠른 출시 |
새로운 성능 지표: TOPS
프로세서를 평가하는 기준이 바뀌고 있습니다. 과거에는 CPU 클럭 속도와 Geekbench 점수가 핵심이었다면, 이제는 TOPS(Tera Operations Per Second) 가 SoC 선택의 새로운 기준입니다.
- Snapdragon 8 Elite NPU: 75 TOPS
- Apple A18 Pro Neural Engine: 35 TOPS
숫자가 클수록 더 크고 복잡한 AI 모델을 기기 내에서 실행할 수 있습니다.
프로세서가 말해주는 것
| 세대 | 경쟁의 기준 | 핵심 전환 |
|---|---|---|
| 1세대 | 클럭 속도(MHz) | 손 안의 컴퓨터 가능성 입증 |
| 2세대 | 코어 수, 벤치마크 | SoC 통합 + 64비트 전환 |
| 3세대 | 제조 공정(nm) | 미세화를 통한 효율·성능 동시 향상 |
| 4세대 | NPU 성능(TOPS) | AI가 기기 안에서 작동하는 시대 |