추론의 환상: AI 세계를 뒤흔들고 있는 논쟁
Apple은 'GSM-심볼릭'(2024년 10월)과 '사고의 환상'(2025년 6월)이라는 두 편의 파괴적인 논문을 발표하여 '하노이탑, 강 건너기' 등 고전적인 문제(숫자 값만 변경하면 성능이 저하된다)의 작은 변형에서 LLM이 어떻게 실패하는지를 보여줍니다. 복잡한 하노이의 탑에서는 전혀 성공하지 못했습니다. 그러나 알렉스 로센(Alex Lawsen, 오픈 필란트로피)은 "사고의 환상"을 통해 실패한 방법론을 반박합니다: 실패는 추론 붕괴가 아닌 토큰 출력 제한, 자동 스크립트가 부분적으로 올바른 출력을 잘못 분류, 일부 퍼즐은 수학적으로 풀 수 없는 문제였습니다. Claude/Gemini/GPT는 동작을 나열하는 대신 재귀 함수를 사용하여 테스트를 반복함으로써 하노이 15번 탑 기록을 풀었습니다. 게리 마커스는 '분포 이동'에 관한 Apple의 논문을 수용하지만, WWDC 전의 타이밍 논문은 전략적 의문을 제기합니다. 비즈니스에 미치는 영향: 중요한 업무에서 AI를 얼마나 신뢰해야 할까요? 해결책: 패턴 인식+언어에는 신경 기호적 접근 방식 신경망, 형식 논리에는 기호적 시스템. 예시: AI 회계는 "출장비는 얼마인가?"라는 질문을 이해하지만, SQL/계산/세무 감사는 결정론적 코드입니다.