프로젝트 구텐베르크가 바꾼 독서의 풍경

digital library archive

1971년, 한 학생이 도서관에서 시작한 일

인류 문명의 가장 위대한 디지털 프로젝트가 1971년 7월 4일 미국 일리노이 대학교의 한 컴퓨터 단말기 앞에서 시작되었다는 사실은 잘 알려져 있지 않습니다. 그날 마이클 하트라는 21세 학생은 학교가 보유한 메인프레임 컴퓨터에 미국 독립선언서의 전문을 타이핑해 입력했습니다. 단순한 입력 작업이 아니었습니다. 그는 이 문서가 앞으로 영원히, 누구나, 무료로 접근할 수 있도록 보존되기를 의도했습니다. 이것이 프로젝트 구텐베르크의 시작이었습니다.

15세기 요하네스 구텐베르크의 금속 활자 발명이 책의 가격을 떨어뜨려 지식의 대중화를 이끌었듯이, 마이클 하트는 디지털 기술이 책의 가격을 0원으로 만들어 또 한 번의 혁명을 일으킬 수 있다고 믿었습니다. 그는 이 프로젝트의 이름을 활자 발명자에게서 따왔으며, 자신의 평생을 이 작업에 헌신했습니다.

50년이 만든 도서관의 규모

2025년 기준 프로젝트 구텐베르크는 7만 7천 권이 넘는 무료 전자책을 보유하고 있습니다. 셰익스피어 전집, 디킨스 전집, 톨스토이 전집, 도스토옙스키 전집은 물론 잘 알려지지 않은 19세기 여행기, 과학사 자료, 시집, 희곡까지 인류의 지식 유산이 거의 망라되어 있습니다.

모든 작품이 공유되는 방식

구텐베르크의 핵심 원칙은 단순합니다. 첫째, 모든 작품은 미국 저작권법 기준으로 퍼블릭 도메인 상태여야 합니다. 둘째, 등록 절차 없이 누구나 즉시 다운로드할 수 있어야 합니다. 셋째, EPUB, MOBI, PDF, 일반 텍스트, HTML 등 다양한 형식으로 제공되어야 합니다. 넷째, 광고가 없어야 합니다. 다섯째, 어떤 결제 정보도 요구하지 않아야 합니다.

이 원칙들은 자명해 보이지만, 21세기 인터넷 환경에서는 거의 기적에 가깝습니다. 대부분의 무료 콘텐츠 사이트가 광고나 회원 가입을 통해 수익을 추구하는 시대에, 구텐베르크는 50년 동안 한 번도 이 원칙을 어기지 않았습니다. 운영은 전적으로 자원봉사자들과 소액 기부로 유지됩니다.

자원봉사자 네트워크가 만든 거대한 협업

7만 7천 권의 책을 디지털화하는 작업은 마이클 하트 한 사람의 힘으로는 불가능했습니다. 그가 만든 가장 위대한 유산은 사실 그 텍스트들이 아니라, 그것을 만들어 낸 자원봉사 네트워크 자체입니다. 전 세계 수만 명의 자원봉사자들이 책을 스캔하고, OCR로 인식한 텍스트를 일일이 교정하며, 메타데이터를 정리합니다.

분산 교정의 힘

‘분산 교정자’라고 불리는 이 시스템에서는 한 페이지를 여러 자원봉사자가 독립적으로 교정합니다. 같은 페이지에 대해 세 명, 네 명의 결과가 모이면 오류 발생 확률이 극적으로 낮아집니다. 이 방식은 위키피디아의 집단 지성과 같은 원리이지만, 사실 구텐베르크가 위키피디아보다 30년 먼저 시작한 모델입니다.

덕분에 구텐베르크의 텍스트는 단순한 스캔본이 아니라 정밀하게 검증된 디지털 텍스트가 됩니다. 학술 연구자들도 인용 가능한 수준의 신뢰도를 확보합니다.

구텐베르크가 다른 유사 프로젝트들에 미친 영향

마이클 하트의 모델은 이후 수많은 후속 프로젝트들의 본보기가 되었습니다.

스탠다드 이북스의 정제

스탠다드 이북스는 구텐베르크의 원본 텍스트를 가져와 현대적인 전자책 표준에 맞춰 다듬는 프로젝트입니다. 구텐베르크가 텍스트의 보존을 우선했다면, 스탠다드 이북스는 시각적 완성도와 가독성에 집중합니다. 두 프로젝트는 경쟁이 아닌 보완 관계에 있습니다.

리브리복스의 음성화

리브리복스는 2005년 캐나다의 휴 맥과이어가 시작한 무료 오디오북 프로젝트입니다. 그는 구텐베르크의 모델에서 직접 영감을 받았다고 밝혔으며, 같은 분산 자원봉사 시스템으로 2만 권이 넘는 오디오북을 만들어냈습니다. 구텐베르크의 텍스트가 리브리복스의 원본이 되며, 이렇게 만들어진 오디오북들은 인터넷 아카이브의 리브리복스 컬렉션에 보존되어 있습니다.

인터넷 아카이브의 보존

인터넷 아카이브는 구텐베르크의 정신을 책에서 웹사이트, 영상, 음원, 소프트웨어로 확장한 거대한 디지털 보존 프로젝트입니다. 1996년 시작되어 현재 수십 페타바이트의 자료를 보유하고 있으며, 구텐베르크의 모든 책을 미러링하고 있습니다.

마이클 하트가 남긴 철학

마이클 하트는 2011년 64세로 사망했습니다. 그러나 그가 남긴 정신은 명확합니다. 그는 생전에 “전자책의 진정한 가치는 무한 복제 가능성에 있다”고 자주 말했습니다. 종이책은 한 권이 한 사람에게 도달하지만, 디지털 책은 한 권이 만 명, 백만 명, 십억 명에게 도달할 수 있습니다. 이 무한 확장성을 가로막는 가장 큰 장벽은 기술이 아니라 저작권의 과도한 연장이라는 것이 그의 일관된 주장이었습니다.

저작권 보호 기간의 역사적 변화

마이클 하트가 프로젝트를 시작한 1971년에는 미국의 저작권 보호 기간이 출간 후 28년, 갱신 시 추가 28년이었습니다. 그러나 그 후 수차례의 법 개정을 거치며 현재는 저작자 사후 70년까지 늘어났습니다. 이 변화는 디지털 퍼블릭 도메인 컬렉션의 성장을 크게 제한했고, 마이클 하트는 죽을 때까지 이에 대해 비판적인 목소리를 냈습니다. 저작권의 본래 목적과 보호 기간에 관한 더 자세한 논의는 퍼블릭 도메인과 크리에이티브 커먼즈의 차이에서 다루었습니다.

50년 후, 한 학생의 작업이 남긴 것

1971년 일리노이의 한 컴퓨터 단말기에서 시작된 작업은 이제 전 세계 수억 명이 매일 활용하는 인프라가 되었습니다. 마이클 하트는 이 일로 단 한 푼도 벌지 않았고, 명성도 추구하지 않았으며, 50년 가까이 같은 일을 반복했습니다. 그가 남긴 가장 큰 메시지는 한 사람의 꾸준한 선의가 인류 문명 전체에 어떤 영향을 미칠 수 있는가에 대한 증거 그 자체입니다.

오늘 당신이 휴대폰으로 톨스토이의 안나 카레니나를 무료로 다운로드받는다면, 그 한 번의 클릭 뒤에는 50년 동안 7만 권의 책을 한 페이지씩 디지털화해 온 수만 명의 자원봉사자가 있다는 사실을 기억해 둘 가치가 있습니다. 휴대폰 독서를 본격적으로 시작하고 싶다면 휴대폰으로 시작하는 디지털 독서의 모든 것을 함께 읽어보기를 권합니다.

위로 스크롤