뉴스

2024.05.28 18:01

'웹 위상 변화, 10년 전 25% 페이지 불접속'

  • 2024.05.28 18:01
  • 15
    0
'20일(현지시간) 일본 IT미디어, 기가진 등 외신에 따르면 퓨 리서치 센터는 비영리 단체 '커먼 크롤'(Common Crawl)의 데이터 저장 자료 리포지토리에서 2013~2023년 동안의 약 9만개 웹사이트와 총 100만건의 웹 페이지 주소(URL)를 분석했습니다. 이 연구 결과에 따르면 이 기간 동안 전체 페이지의 25%가 현재는 접속이 불가능한 것으로 나타났습니다. 이 중 16%는 도메인 주소는 활성화되어 있지만 웹페이지에 접근할 수 없었고, 나머지 9%는 도메인 주소 자체가 사라진 것으로 확인되었습니다. 사이트별로 보면 정부 공식 사이트에서는 조사 대상의 약 50만 페이지 중 21%에서 접속이 차단된 링크가 발견되었으며, 이러한 현상은 지방자치단체 페이지에서 특히 두드러졌습니다. 뉴스 미디어 사이트에서는 23%의 페이지가 접속 불가능했으며, 위키피디아 영문판에서는 절반 이상이 접속이 불가능한 것으로 조사되었습니다. 또한, 퓨 리서치 센터는 2023년 3월 초부터 4월 말까지 엑스(구 트위터)에 게시된 약 500만건의 게시물을 분석했습니다. 이 중 18%의 게시물이 현재 사라진 상태이며, 이 중 60%는 게시한 계정이 비공개로 전환되거나 삭제 및 정지 처리된 것으로 나타났습니다. 또한 1%의 게시물은 한 시간 이내에 삭제 처리되었으며, 3%는 하루 이내, 10%는 일주일 이내, 15%는 한 달 이내에 삭제된 것으로 나타났습니다. 특히 터키어와 아랍어로 된 게시물의 삭제 속도가 두드러지며, 해당 콘텐츠의 40% 이상이 게시된 지 3개월 이내에 접근이 불가능한 것으로 나타났습니다. 그러나 일부 사라진 게시물은 추후 계정 부활이나 공개 전환 등으로 다시 접근이 가능했다고 퓨 리서치 센터는 설명했습니다. 퓨 리서치 센터가 정의한 비공개 링크는 페이지가 더 이상 호스트 서버에 존재하지 않거나, 호스트 서버 자체가 더 이상 존재하지 않는 경우를 의미합니다. 또한 페이지 주소는 존재하지만 콘텐츠가 변경된 경우도 포함됩니다. 연도별 콘텐츠 추이는 다양했습니다. 현재 기준으로 2013년에 게시된 웹페이지의 38%와 2023년에 게시된 콘텐츠의 8%가 더 이상 접근이 불가능했습니다. 퓨 리서치 센터는 '수천억달러 규모의 정보를 담고 있는 인터넷은 상상할 수 없을 정도로 방대한 현대 생활의 저장소'라며 '전 세계 사용자가 웹을 통해 다양한 콘텐츠를 활용하고 있지만 해당 콘텐츠가 사라지는 경우가 많다'고 설명했습니다. 또한 '가치 있는 콘텐츠를 보존하려는 노력이 필요하며 그 가치는 더 높이 평가될 것'이라고 덧붙였습니다.'
  • 공유링크 복사

    댓글목록

    등록된 댓글이 없습니다.