| 1_
슬슬 시간이 지나가면서 그래도 공부를 계속해야겠다는 쪽으로 생각을 정리해가고 있다. 이렇게 명확하지 않은 것이 아직 졸업이 좀 남았기 때문이라는 말도 들었다.
확실히 면접을 보고 취직을 하게 되면 그 길에 대한 생각을 정리할 수 있는 기회를 가지게 되는 것 같다. 최근에 취직한 친구가 명확하게 자신이 선택한 길에 대한 동기와 목표를 말하는 것을 보니 그런 생각이 들었다. 그리고 그 친구를 지난 달, 면접 및 오퍼 전에도 만났었기 때문에 그 변화가 새삼 크게 다가왔던 것 같다. 녀석은 지금까지 해왔던 많은 생각과, 고려했던 여러갈래 길 중에 하나를 선택하여 논리를 갈고 닦아 멋지게 정리해냈다. 나 역시 지금까지 생각했던 여러 진로 중에 하나를 선택하여 나의 신념을 담아 그만큼 멋지게 정리해 낼 수 있기를 바란다.
2_ Complex Network, Epidemiology
최근에는 연구참여 과목을 통해 통계물리이론 관련 공부를 하고 있다. 마음에 드는 페이퍼 하나를 골라서 내용을 따라가보고, 컴퓨터 시뮬레이션을 재생산 해보는 것이다. 내가 고른 논문은 Physical Review Letter에 2001년 발표된 논문으로, 척도없는 네트워크(Scale-free Network)에서 전염병 확산 현상을 살펴보는 것이다. 이 주제를 이해하기 위해서는 (1)척도없는 네트워크와 (2)전염병 확산 모델에 대해 알아야 하고, 이 둘을 어떻게 결합시켜 현실세계의 문제들을 다룰지 고민해보아야 한다.
(1) 척도없는 네트워크
우선 네트워크 이야기부터 해보자. 출발은 수학의 그래프 이론이다. 수학에서 오래된 문제 중에 '쾨니히스베르크 다리' 문제 라는 것이 있다. 쾨니히스베르크에 있는 7개의 다리를 한번도 똑같은 다리를 지나지 않고 전부 건널 수 있겠느냐는 것이다. 이것을 그래프로 변환하여 '한붓그리기'문제로 변환해 푼 것이 그래프 이론의 시작이다. 그래프 이론에서는 어떤 객체를 노드(Node, 마디), 그리고 그들 사이의 관계를 연결선(Edge)으로 표현한다. 쾨니히스베르크 문제에서는 다리가 놓여져있는 땅이 노드, 다리가 연결선 역할을 한다.
그래프 이론은 20세기 들어 에르되스, 레니 등이 무작위 그래프(Random Network)를 연구하여 소정의 성과를 올렸다. 이것은 노드 사이의 연결선이 무작위적으로 연결되어 있기 때문에 각 노드에 연결된 연결선 수가 평균 연결선수에서 크게 벗어나지 않는다.
하지만 실제 사람 사이의 인간관계, 인터넷, 웹페이지의 연결 등을 살펴보니 무작위 그래프로는 그들을 적절히 모사할 수 없었다. 이런 네트워크들은 복잡하기도 했지만, 연결선 수(k)와 그 연결선 수를 가지는 노드의 비율(P(k))이 일정한 관계를 가지고 있었다. 즉, 어떤 연결선 수를 가지는 노드의 비율(P(k))이 연결선 수의 멱급수 꼴(~k^-r, r은 상수)에 비례했다. 이 말은 대부분의 노드들은 작은 연결선수를 가지고 있지만, 대단히 많은 연결선 수를 가지는 노드들도 소수 존재한다는 뜻이다. 이런 네트워크를 척도없는 네트워크(Scale-free Network)라고 한다.
척도없는 네트워크는 앞서 말했듯이 현실세계에 나타나는 많은 네트워크뿐 아니라 체내에서 작용하는 단백질 네트워크, 인간 질병 사이의 연관관계 네트워크 등에서도 찾아볼 수 있다.
(2) 전염병 확산 모델
전통적인 전염병학(Epidemiology)은 주로 의학이나 생물학 쪽에서 연구가 되어오던 주제이다. 이것을 시뮬레이션 하기 위해서는 각 노드가 다음의 상태들을 가질 수 있다고 가정한다. 가능한 상태로 크게 전염병에 걸릴 수 있는 상태(S: Susceptible), 전염병에 걸린 상태(I: Infected), 전염병에 걸려서 제거된 상태(R: Removed)를 가정하여 상황에 따라 적절한 모델을 구성한다. 전염병에 걸렸다가 다시 회복되어 다시 전염병에 걸릴 수 있는 상태를 모사하기 위해서 SIS 모델을 사용한다. 이것은 컴퓨터 바이러스의 확산을 모델링하기에 좋은 방법이다. 왜냐하면 대체로 컴퓨터 바이러스에 걸려도 컴퓨터는 백신 프로그램으로 치료하여 원상태로 돌아오지만 계속해서 면역을 지속하지만은 않기 때문이다.
전염병 확산은 S 상태의 노드 주위에 감염된 노드(I)가 하나 이상 있을 경우 일정한 확률 nu로 S 상태의 노드가 감염된다(I 상태로 전환). 이것을 모든 노드에 대해서 업데이트 하는 방법으로 병렬 업데이트(Parallel Updating) 방법이 있고, 순차적 업데이트(Sequential Updating) 방법이 있다. 전자는 시간을 고정시켜놓고 S 상태 노드들을 스캔하면서 감염여부를 결정하는 것이고, 후자는 (예를 들어) 감염된 노드로부터 출발하여 그 노드에 의해 감염된 다른 노드를 따라가면서 주위의 노드를 감염시키는 방법이다.
(3) 척도없는 네트워크에서의 전염병 확산 모델
전염병 확산 모델을 척도없는 네트워크 위에서 실행해보는 것이다. 실제 인터넷이나 웹페이지의 연결, 사회 네트워크 등이 연결선수 비율 P(k)가 k^-r에 비례하고 r=2~3인 척도없는 네트워크임이 알려져 있다.
Reference: R. Pastor-Satorras, A. Vespignani, Physical Rev. Lett. 86, 14 (2001).
어쨌든 이 주제에 대해서 컴퓨터 시뮬레이션을 하고 있고, 코드는 어느 정도 완성이 되어서 지금은 반복계산을 해서 시뮬레이션 결과를 얻어내고 있다. 논문의 결과와 일치하는 데이터들이 나오고 있으니 그럭저럭 잘 된 거겠지.
3_
입자물리, 고체물리, 생물물리 등은 다루는 대상으로 분야가 정의되지만, 통계물리는 사용하는 방법론에 의해서 분류된다. 통계물리학적 방법론을 가지고 네트워크, 생물현상, 전염병 확산 등을 다룰 수 있는 것이다. 그런 실용적인 활용이 마음에 든다.
그리고 지금까지 해놓은 것이 많긴 하지만, 특히 입자물리 등과 비교하면 할 수 있는 일이 더 많은 것 같다. 즉, 해놓은 일이 상대적으로 적은 느낌. 아직 잘 몰라서 그럴 수도 있지만, 입자물리의 경우 깊이 공부하려고 하면 일단 압도적인 양의 문헌들이 존재하지만, 통계물리 쪽은 몇 십 년 전에 나온 클래식 텍스트들 빼고는 최신 성과들을 기록한 문헌들이 상당히 부족한 느낌이 든다.
어쨌든 그런 면에서 통계물리에도 매력을 느낀다. 거의 마무리 되어가니까 얼른 결과 뽑아내서 장표 만들어야겠다.
4_
토플 맙소사.
오사카 시험 얼른 등록.
수업 그럭저럭 잘 따라가며 공부하는 중.
오늘 아메바 같은 단세포 생물의 학습 및 기억능력에 대한 일본인 박사님의 세미나를 봤는데, 꽤 흥미로웠는데도 불구하고 영어가 알아듣기 힘들어서 꽤 고생을 했다. 여러모로 영어공부 열심히 해야겠다는 생각이 들긴 하는데 ... 뭔가 갈 수록 영어능력은 떨어지는 것만 같은.
망할 토플. |