공돌이는 파닥파닥


점점 진화해 가는 임베디드 환경과 모든 것을 자신의 일부로 만들어 버리는 웹의 발달에 힘입어 '분산 컴퓨팅'의 발전도 가속되어 가고 있다.

그러던 와중에 '분산 컴퓨팅 프레임워크'인 Hadoop을 만났는데.
뭐랄까... 설치하고 사용하는 것도 나름 고된 일이긴 했지만
보다 근본적인 '어떻게 분산 파일을 저장하는가'와 '어떻게 잡을 나누고 할당하는가'가 궁금해 졌다.

해서, 분산 파일시스템을 찾다가 찾다가

P2P 공유 프로그램인 eMule이 사용중인 Kademlia 네트워크 프로토콜이 떠올라
관련된 기술 문서를 읽고 Design Specification은 번역 중에 있다(해봤자 발번역이지만..).

가장 핵심적인 기술은 DHT(Discreate Hash Table)이고 이 해쉬 테이블에 사용될 해쉬 함수도
상당히 믿을 만하게 유일한 값을 줘야 한다(Kademlia Network 문서 에선 quasi-unique라 설명합니다).

이런 조사들을 하다 보면 생소한 단어들을 많이 보게 되는데, 몇몇 수학적인 용어들이 있어 긴장된다.
아직 정확히 알아낸 바가 없지만, 이러한 분산 시스템과 Swarm Intelligence나 Collective Intelligence,
그리고 웹을 생각하며 물고 늘어지면 뭔가가 나오지 않을까.

수학 공부 좀 하자...

Comment +0