Бизнес работает круглосуточно. Это включает в себя все, от веб-сайта, бэк-офиса, цепочки поставок и так далее. В другой раз все запускалось партиями. Еще несколько лет назад операционные системы были приостановлены, чтобы данные можно было загрузить в хранилище данных и запустить отчеты. Теперь отчеты о том, как обстоят дела в данный момент. Нет времени на ETL.

Большая часть ИТ-архитектуры по-прежнему основана на звездообразной системе. Операционные системы наполняют хранилище данных, которое затем наполняет другие системы. Специализированное программное обеспечение для визуализации создает отчеты и информационные панели на основе «склада». Однако это меняется, и эти изменения в бизнесе требуют адаптации как баз данных, так и системной архитектуры.

Меньше копий, лучше базы данных

Часть большой миграции в облако и усилия по масштабированию за последнее десятилетие привели к использованию множества специально созданных баз данных. Во многих компаниях веб-сайт поддерживается База данных NoSQL, в то время как критически важные системы, связанные с деньгами, находятся на мейнфрейме или в реляционной базе данных. Это только поверхность вопроса. Для многих задач используются еще более специализированные базы данных. Часто эта архитектура требует перемещения большого количества данных с использованием традиционных пакетных процессов. Операционная сложность приводит не только к задержке, но и к сбоям. Эта архитектура не создавалась в масштабе, а была собрана вместе, чтобы остановить кровотечение.

Базы данных меняются. Реляционные базы данных теперь могут обрабатывать неструктурированные, документированные данные и данные JSON. Базы данных NoSQL теперь имеют хотя бы некоторую поддержку транзакций. В то же время распределенные базы данных SQL обеспечивают целостность данных, реляционные данные и исключительную масштабируемость, сохраняя при этом совместимость с существующими базами данных и инструментами SQL.

Однако этого самого по себе недостаточно. Линия между транзакционные или операционные системы и аналитические системы не может быть границей. База данных должна обрабатывать как множество пользователей, так и длительные запросы, по крайней мере, большую часть времени. С этой целью в транзакционные/операционные базы данных добавляются аналитические возможности в виде столбцовых индексов или возможностей MPP (массово-параллельной обработки). Теперь можно выполнять аналитические запросы к некоторым распределенным операционным базам данных, таким как MariaDB Xpand (распределенный SQL) или Couchbase (распределенный NoSQL).

Никогда не извлекать

Это не означает, что технология находится в таком месте, где специализированные базы данных не нужны. Ни одна действующая база данных в настоящее время не способна выполнять петабайтную аналитику. Есть крайние случаи, когда ничего, кроме временных рядов или другой специализированной базы данных, не будет работать. Хитрость в том, чтобы упростить вещи или добиться аналитики в реальном времени, заключается в том, чтобы избегать извлечений.

Авторское право © 2023 IDG Communications, Inc.



Source link