HighTech Reporter
новости и обзоры хай-тека

Самая большая база данных — в Yahoo на базе PostgreSQL

Компания Yahoo утверждает, что ей удалось побить мировой рекорд, создав самую большую и нагруженную базу данных в мире, которая функционирует на основе свободной СУБД PostgreSQL, сообщает «Постгресмен».

Объём запущенной Yahoo год назад базы данных достиг 2 петабайт. Система создана для аналитических целей, в ней хранится история поведения Web-пользователей (утверждается, что в месяц сохраняются данные о полумиллиарде пользователей). Помимо прочего, интернет-гигант заявляет, что это не только самая большая БД в мире, но ещё и самая нагруженная — в сутки в ней регистрируются данные о 24 млрд событиях.

Управлением базами данных занимается модифицированная версия СУБД PostgreSQL. Это стало возможным благодаря покупке Yahoo компании-стартапа Mahat Technologies, изначально работающей с PostgreSQL. Код свободной СУБД был модифицирован для работы с такими огромными объемами информации (одно из самых крупных изменений: ориентация на поколоночное хранение вместо традиционного построчного, что замедляет запись на диск, но обеспечивает лучшую скорость доступа к данным для аналитических целей). Положительный результат налицо: некоторые таблицы в базе содержат триллионы строк, которые не просто лежат мертвым грузом на дисках, но могут быть запрошены и обработаны стандартным SQL, в стандартной ACID-совместимой среде.

citcity.ru

Последняя модификация: 30 Май, 2008

публикация была размещена Пятница, 30 мая, 2008 в 06:20 и помещена в Компьютерные новости. Вы можете отслеживать комментарии на эту публикацию на RSS 2.0 ленте. Комментирование и пинги запрещены.

Еще стоит прочитать о:

Комментирование закрыто.