CS 194/294-280 (Advanced LLM Agents) - Lecture 11, Swarat Chaudhuri
LLM, 수학과 과학 발견의 새로운 도구
이 강의에서는 LLM(거대 언어 모델)이 수학과 과학 발견에 어떻게 활용될 수 있는지 알아볼 거야. 특히 LLM이 추상적인 개념을 발견하고, 이를 통해 발견 과정을 어떻게 가속화할 수 있는지에 초점을 맞출 거야.
1. 수학 발견: LLM과 함께하는 새로운 시대
수학 발견은 인류의 오랜 숙제 중 하나야. 수학적 발견 과정은 보통 다음과 같은 단계를 거쳐.
- 모델링: 현실 세계의 현상에서 영감을 얻어 정의와 개념으로 모델을 만드는 과정.
- 추측: 만들어진 정의를 바탕으로 다양한 속성을 추측하고, 이를 정리나 보조 정리 후보로 삼는 과정.
- 엄밀한 추론: 추측한 내용을 증명하는 과정. 이 과정은 인간 수학자들 사이에서 서로의 논리를 설득하고 검증하는 사회적인 과정이기도 해.
이런 과정은 계속 반복되면서 발전하는데, 때로는 증명이나 반례를 통해 모델이나 추측을 수정하기도 하지.
AI가 수학 분야에 뛰어든 이유는 바로 이 과정을 자동화해서 발견 속도를 높이고, 새로운 수학을 발견하기 위해서야. 알려진 추측을 증명하거나 새로운 추측을 만들어내는 것이 목표지.
LLM이 수학 발견에 기여하는 점:
- 방대한 지식 활용: LLM은 이미 많은 수학적 지식을 학습했기 때문에, 어떤 추측이 유효할 가능성이 높은지 방향을 제시해 줄 수 있어.
- 경험 학습: LLM 에이전트는 실제 세계와 상호작용하며 경험을 쌓고 학습할 수 있어. 이 경험은 모델을 개선하는 데 사용되지.
- 추상화 능력: LLM은 새로운 개념과 도구를 발견하는 데 도움을 줄 수 있는데, 이는 과학 발전에도 큰 영향을 미쳤어. 예를 들어 미적분학이나 대수학 같은 것들이 그렇지.
LLM만으로는 부족한 이유:
- 데이터 부족: 엄밀한 수학적 추론을 위해서는 고품질의 증명 과정 데이터가 많이 필요한데, 인간이 만든 데이터만으로는 한계가 있어.
- 언어 추론의 한계: 자연어로 이루어진 추론은 검증하기 어렵고, 특히 현실 세계 시스템에 적용될 때는 오류가 치명적일 수 있어.
대안: LLM 에이전트와 형식화
이런 한계를 극복하기 위해 LLM 에이전트와 형식화라는 접근 방식이 등장했어.
- 형식화: 비공식적인 수학 문제를 'Lean'이나 'Coq' 같은 형식 언어로 바꾸는 과정이야. 이렇게 하면 컴퓨터가 이해할 수 있는 코드가 되고, 증명 과정도 검증하기 쉬워져.
- LLM 에이전트: LLM을 핵심으로 삼고, 외부 도구와 상호작용하며 학습하는 시스템이야.
Copra 시스템:
- LLM이 증명 단계를 예측하고, 증명 환경(Lean 등)이 이를 실행하며 새로운 상태를 제공하는 방식으로 작동해.
- 별도의 강화 학습 없이도 LLM의 능력과 프롬프트 엔지니어링만으로 좋은 성과를 낼 수 있어.
- 자연어와 형식 언어를 함께 사용할 수 있다는 장점이 있어.
- 새로운 문제에 대해서도 기존 지식을 활용하여 해결할 수 있어.
Copra의 장점:
- 유연성: 프롬프트만 조금 바꿔도 다양한 작업을 수행할 수 있어.
- 계층적 추론: 복잡한 문제를 작은 하위 문제로 나누어 해결할 수 있어.
- 검증의 중요성: Lean 같은 증명 도구와의 상호작용은 LLM의 오류를 줄이고 정확도를 높이는 데 필수적이야.
2. 과학 발견: LLM과 함께하는 데이터 기반 탐구
자연과학에서는 현실 세계의 데이터를 기반으로 가설을 세우고 실험을 통해 검증하는 과정이 중요해. LLM은 이 과정에서도 큰 역할을 할 수 있어.
LLM의 과학 발견 기여:
- 가설 생성: LLM은 방대한 과학 지식을 바탕으로 새로운 가설을 생성할 수 있어.
- 추상화: 다양한 데이터와 법칙에서 공통적인 패턴이나 개념을 추출하여 추상화할 수 있어.
- 기존 지식 활용: 물리학자들의 지식이나 LLM 내부에 저장된 상식적인 지식을 활용하여 가설을 만들 수 있어.
기호 회귀 (Symbolic Regression):
- 데이터를 기반으로 수학 방정식을 찾아내는 기술이야. LLM은 이 과정에서 잠재적인 방정식을 생성하고, 외부 도구가 이를 평가하는 방식으로 작동할 수 있어.
- LLM 기반 진화 알고리즘: LLM을 활용하여 기존의 유전 프로그래밍보다 더 효율적으로 방정식을 찾고, 추상적인 개념을 발견할 수 있어.
Laser 시스템:
- LLM을 사용하여 가설(방정식)을 생성하고, 이를 추상적인 개념으로 설명하며, 이 과정에서 얻은 지식을 다시 가설 생성에 활용하는 순환 구조를 가져.
- 이러한 과정을 통해 새로운 과학 법칙을 발견하거나 기존 법칙을 개선할 수 있어.
실제 적용 사례:
- 쿨롱 법칙 발견: LLM은 데이터만으로 쿨롱 법칙과 같은 물리 법칙을 발견할 수 있었어.
- LLM 스케일링 법칙 발견: LLM 자체의 성능을 예측하는 새로운 스케일링 법칙을 발견하는 데에도 활용되었어.
결론
LLM 에이전트는 수학과 과학 발견 모두에서 강력한 도구가 될 수 있어. 특히 LLM의 추상화 능력과 방대한 지식을 활용하여, 기존에는 어려웠던 발견 과정을 가속화하고 새로운 통찰력을 얻을 수 있지. 아직 초기 단계이지만, LLM 에이전트와 다양한 도구의 결합은 앞으로 과학 기술 발전에 큰 영향을 미칠 것으로 기대돼.