Курсовая работа

«Хранилища данных»

  • 30 страниц
Содержание

Введение…3

1. Основные подходы к архитектуре Хранилищ данных.…6

1.1 Хранилище данных с архитектурой CIF….….….…6

1.2 Хранилище данных с архитектурой BUS….….…7

1.3 Основные требования к структуре Хранилища данных ….….9

2. Способы оптимизации работы Хранилищ данных ….11

2.1 Управление жизненным циклом информации….….11

2.2 Принципы ILM для Хранилищ данных….…12

2.3 Устройства для Хранилищ данных….…14

3. Основные характеристики современного Хранилища данных….…20

3.1 Расширенный уровень подготовки данных…20

3.2 Сервисно - ориентированное взаимодействие….…22

3.3 Управление метаданными….…23

Заключение….26

Глоссарий…28

Список использованных источников…31

Приложение А ….…33

Приложение Б ….…34

Введение

Современные организации вынуждены быстро реагировать на изменения, происходящие на рынке. Ясно, чтобы делать это, необходим быстрый доступ ко всем видам информации прежде, чем можно принять любые логические решения. Чтобы помочь принятию правильного решения для организации, необходимо иметь средства исследования прошлого и на основании этого определить соответствующие тенденции. Далее, чтобы выполнять любой анализ тенденций, необходимо иметь доступ ко всей требуемой информации, и эта информация хранится в основном в очень больших базах данных. Наиболее простой способ получить доступ к этим данным и помочь эффективному процессу принятия решений состоит в том, чтобы установить Хранилище данных (англ. Data Warehouse). С Хранилищами данных связывали и продолжают связывать большие надежды в сфере развития информационной индустрии.

Для развития и процветания бизнеса недостаточно просто владеть информацией, все зависит от качества владения-умения четко и быстро определять категорию показателей, на основании которых требуется принимать решение, проводить анализ определенных значений данных показателей с различной степенью детализации с учетом всех параметров, оказывающих на них влияние. Хранилище данных является хорошим инструментом в решении данной задачи. Тот, у кого есть средства, позволяющие четко представить картину бизнес-данных, их взаимосвязь, историю возникновения, временную глубину, оказывается в выигрыше. Он может отследить тенденции развития, спрогнозировать возможные изменения, и, соответственно, получить конкурентные преимущества.

В большинстве организаций существуют действительно большие базы данных при работе с нормальными ежедневными транзакциями, а некоторые приложения используют транзакционные мониторы. Эти типы баз данных известны как операционные базы данных. Как правило, они были разработаны, не для того чтобы хранить историю данных или отвечать на запросы, а для того чтобы поддерживать все приложения для повседневных транзакций. Поэтому они оптимизированы для этого типа работы, с быстрой реакцией и с большим числом пользователей.

Второй тип баз данных, получивших распространение в организациях - это Хранилище данных. Оно проектируется для стратегической поддержки принятия решений, и, в значительной степени формируется из баз данных, которые являются операционными. Основная характеристика хранилища данных состоит в том, что оно содержит громадное количество данных (миллиарды записей). Меньшие, локальные хранилища данных называются информационными витринами (англ. Datamarts).

Фрагмент работы

1. Основные подходы к архитектуре Хранилищ данных На сегодняшний день существует два основных подхода к архитектуре Хранилищ данных. Это так называемая корпоративная информационная фабрика (англ. Corporate Information Factory - CIF) Билла Инмона и Хранилище данных с архитектурой шины (англ. Data Warehouse Bus - BUS) Ральфа Кимболла (Ralph Kimball). Рассмотрим каждый из них подробнее. 1.1 Хранилище данных с архитектурой CIF На рисунке представлен подход, используемый в Хранилищах данных с архитектурой CIF. Когда-то этот подход был известен под названием корпоративного Хранилища данных (англ. Enterprise Data Warehouse - EDW). Работа такого Хранилища начинается со скоординированного извлечения данных из источников. После этого загружается реляционная база данных с третьей нормальной формой, содержащая атомарные данные. Получившееся нормализованное Хранилище используется для того, чтобы наполнить информацией дополнительные репозитории презентационных данных, т.е. данных, подготовленных для анализа. Эти репозитории, в частности, включают специализированные Хранилища для изучения и "добычи" данных (англ. Data Mining), а также витрины данных. При таком сценарии конечные витрины данных создаются для обслуживания бизнес-отделов или для реализации бизнес-функций и используют пространственную модель для структурирования суммарных данных. Атомарные данные остаются доступными через нормализованное Хранилище данных. Очевидно, что структура атомарных и суммарных данных при таком подходе существенно различается .

Заключение

Если исходить из результатов различных аналитических исследований, то будущее платформ для Хранилищ данных пока внушает оптимизм. Объемы и разнообразие типов данных только расширяются, изменяется состав источников данных (таких как геопространственные и другие неструктурированные данные), которые поставщики преобразуют в структурированную информацию. На рынке средств генерирования Хранилищ данных ключевой тенденцией является внедрение инструментов загрузки данных в режиме близком, к реальному времени. В прошлом многие технологии интеграции разрабатывались вне технологий Хранилищ, однако все чаще и чаще идея непрерывного обновления Хранилищ данных находит свое реальное воплощение. Качество данных, метаданные и управление нормативно-справочной информацией (англ. MDM — Master Data Management) получают все более широкое признание. Перед многими сегодня стоит цель добиться решения вечных проблем бизнеса и IT, связанных с управлением качеством информации.

Список литературы

1. Архипенков С.Я., Голубев Д.В., Максименко О.Б. Хранилища данных. - М.: Диалог-МИФИ [Текст], 2002. ISBN 5-86404-167-X

2. Туманов В.Е Проектирование реляционных хранилищ данных. - М.: Диалог-МИФИ [Текст], 2007. ISBN 5-86404-210-2, 978-5-86404-210-6

3. Дэвид Уэддингтон (David Waddington). Архитектурный подход к интеграции информации: обзор проблемы федеративных Хранилищ данных. (An Architected Approach to Information Integration - Federated Enterprise Data Warehousing Overview) – URL: h**t://hosteddocs.ittoolbox.com/DW041505.pdf

4. Кен Пол (Ken Pohl). Управление проектом Хранилища данных (Data Warehouse Project Management) - URL: h**t://w*w.dmreview.com/editorial/dmreview/ print_action.cfm?articleId=1048521.

5. Кэтэрин Дрюэк (Katherine Drewek). "Хранилища данных: подход Билла Инмона" (Data Warehouse: Ralph Kimball's Vision) – URL: h**t://w*w.b-eye-network.com/view/727.

6. Кэтэрин Дрюэк (Katherine Drewek). "Хранилища данных: подход Ральфа Кимболла"(Data Warehouse: Bill Inmon's Vision) – URL: h**t://w*w.b-eye-network.com/view/713.

7. Майкл Дженнинз (Michael Jennings). Производительность Хранилищ данных: проблемы и способы решения (Performance Impacts on the Data Warehouse Environment). Части 1 и 2. – URL: h**t://w*w.dmreview.com/portals/ portalarticle.cfm? articleId=1014664&topicId=230007.

8. Майкл Хэйстен (Michael Haisten). "Хранилище данных в режиме реального времени: следующая стадия в развитии Хранилищ данных" (The Real-Time Data Warehouse: The Next Stage in Data Warehouse Evolution) – URL: h**t://w*w.damanconsulting.com/company/articles/dwrealtime.htm.

9. Марджи Росс (Margy Ross) и Ральф Кимболл (Ralph Kimball). "Различные мнения" (Differences of Opinion) – URL: h**t://w*w.intelligententerprise.com/showArticle.jhtml?articleID=17800088.

10. Adamson, C., Venerable, M., "Data Warehouse Design Solutions". John Wiley & Sons, Inc (2003). ISBN 047125195X.

11. Devlin, B., "Data warehouse: from architecture to implementation". Addison Wesley Longman, Inc. (2004). ISBN 0201964252.

12. Kimball, R., "The Data Warehouse Toolkit. Practical Techniques for Building Dimensional Data Warehouses". John Wiley & Sons, Inc (2003). ISBN 0471153370.

13. Kimball, R. et al., "The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing and Deploying Data Warehouses". John Wiley & Sons, Inc (2005). ISBN 0471255475.

Покупка готовой работы
Тема: «Хранилища данных»
Раздел: Информатика
Тип: Курсовая работа
Страниц: 30
Цена: 400 руб.
Нужна похожая работа?
Закажите авторскую работу по вашему заданию.
  • Цены ниже рыночных
  • Удобный личный кабинет
  • Необходимый уровень антиплагиата
  • Прямое общение с исполнителем вашей работы
  • Бесплатные доработки и консультации
  • Минимальные сроки выполнения

Мы уже помогли 24535 студентам

Средний балл наших работ

  • 4.89 из 5
Узнайте стоимость
написания вашей работы
Популярные услуги
Дипломная на заказ

Дипломная работа

от 8000 руб.

срок: от 6 дней

Курсовая на заказ

Курсовая работа

от 1500 руб.

срок: от 3 дней

Отчет по практике на заказ

Отчет по практике

от 1500 руб.

срок: от 2 дней

Контрольная работа на заказ

Контрольная работа

от 100 руб.

срок: от 1 дня

Реферат на заказ

Реферат

от 700 руб.

срок: от 1 дня

682 автора

помогают студентам

23 задания

за последние сутки

10 минут

среднее время отклика