Рефераты. Курсовая: Теория баз данных и их создание в среде Microsoft Access97

Курсовая: Теория баз данных и их создание в среде Microsoft Access97

Веками человечество накапливало знания, навыки работы, сведения об
окружающем мире, другими словами – собирало информацию. Вначале
информация передавалась из поколения в поколение в виде преданий и
устных рассказов. Возникновение и развитие книжного дела позволило
передавать и хранить информацию в более надежном письменном виде.
Открытия в области электричества привели к появлению телеграфа,
телефона, радио, телевидения – средств, позволяющих оперативно
передавать и накапливать информацию. Развитие прогресса обусловило
резкий рост информации, в связи с чем вопрос о ее сохранении и
переработке становился год от года острее. С появлением вычислительной
техники значительно упростились способы хранения, а главное, обработки
информации. Развитие вычислительной техники на базе микропроцессоров
приводит к совершенствованию компьютеров и программного обеспечения.
Появляются программы, способные обработать большие потоки информации. С
помощью таких программ создаются информационные системы. Целью любой
информационной системы является обработка данных об объектах и явлениях
реального мира и предоставление человеку нужной информации о них. Если
мы рассмотрим совокупность некоторых объектов, то сможем выделить
объекты, обладающие одинаковыми свойствами. Такие объекты выделяют в
отдельные классы. Внутри выделенного класса объекты можно упорядочивать
как по общим правилам классифицирования, например по алфавиту, так и по
некоторым конкретным общим признакам, например по цвету или материалу.
Группировка объектов по определенным признакам значительно облегчает
поиск и отбор информации.

Информационные системы (ИС) можно условно разделить на фактографические
и документальные.

В фактографических ИС регистрируются факты – конкретные значения данных
(атрибутов) об объектах реального мира. Основная идея таких систем
заключается в том, что все сведения об объектах (фамилии людей и
названия предметов, числа, даты) сообщаются компьютеру в каком-то
заранее обусловленном формате (например дата – в виде комбинации
ДД.ММ.ГГГГ). Информация, с которой работает фактографическая ИС, имеет
четкую структуру, позволяющую машине отличать одно данное от другого,
например фамилию от должности человека, дату рождения от роста и т.п.
Поэтому фактографическая система способна давать однозначные ответы на
поставленные вопросы.

Документальные ИС обслуживают принципиально иной класс задач, которые не
предполагают однозначного ответа на поставленный вопрос. Базу данных
таких систем образует совокупность неструктурированных текстовых
документов (статьи, книги, рефераты и т.д.) и графических объектов,
снабженная тем или иным формализованным аппаратом поиска. Цель системы,
как правило, - выдать в ответ на запрос пользователя список документов
или объектов, в какой-то мере удовлетворяющих сформулированным в запросе
условиям.

Указанная классификация ИС в известной мере устарела, так как
современные фактографические системы часто работают с
неструктурированными блоками информации (текстами, графикой, звуком,
видео), снабженными структурированными описателями. Чтобы пояснить, как
фактографическая система может превратиться в документальную (и
наоборот), рассмотрим условный пример.

Пусть объектом обработки фактографической ИС является некий список
ученых-экономистов, причем для каждого ученого имеются следующие данные:

Имя ;

Дата рождения в формате ДД.ММ.ГГГГ;

Национальность (русский или иностранец);

Биография (произвольный текст);

Названия трудов ученого.

Располагая структурированными описателями (имя, дата, пол), система
может выдать строгие ответы на вопросы: а) о любом ученом персонально;
б) о распределении ученых по дате рождения и полу (в любых сочетаниях).
Заметим, что те же данные в той или иной форме дублируются в биографии,
например: «Уильям Стаффорд родился в 1554 году в семье…», «Иван
Тихонович Посошков жил с 1652 по 1726 год…» и т.д. Однако, если удалить
из списка структурированные описатели, система превратится в
документальную и, если не принять мер, утратит способность находить и
классифицировать ученых. В отличие от нас, компьютер не знает, что
Стаффорд – иностранец, а Посошков – русский, что «родиться» и «жить с…
по…» - синонимы и т.д.

В данной работе рассматриваются фактографические ИС, которые
используются буквально во всех сферах человеческой деятельности, а
практика работы с ними будет рассмотрена на примере современной системы
управления базами данных (СУБД) Microsoft Access.

Базы данных

Основа ИС, объект ее обработки – база данных.

Что такое база данных (БД)? В широком смысле слова можно сказать, что БД
– это совокупность сведений о конкретных объектах реального мира в
какой-либо предметной области. Синоним термина «база данных» – «банк
данных».

Чтобы обеспечить быстроту и качество поиска данных в базе, этот процесс
должен быть автоматизирован. Компьютерную базу данных можно создать
несколькими способами:

С помощью алгоритмических языков программирования, таких как Basic,
Pascal, C++ и т.д. Данный способ применяется для создания уникальных баз
данных.

С помощью прикладной среды, например Visual Basic. С его помощью можно
создавать базы данных, требующие каких-то индивидуальных особенностей
построения.

С помощью специальных программных сред, которые называются системами
управления базами данных.

В настоящее время существует несколько видов СУБД. Наиболее известными и
популярными СУБД являются Access, FoxPro и Paradox.

БД может быть основана на одной модели или на совокупности нескольких
моделей. Любую модель данных можно рассматривать как объект, который
характеризуется своими свойствами (параметрами), и над ней, как над
объектом, можно производить какие-либо действия.

Существуют три основных типа моделей данных – реляционная, иерархическая
и сетевая.

Реляционная модель

Термин «реляционный» (от латинского relatio – отношение) указывает
прежде всего на то, что такая модель хранения данных построена на
взаимоотношении составляющих ее частей. В простейшем случае она
представляет собой двухмерный массив или двухмерную таблицу, а при
создании сложных информационных моделей составит совокупность
взаимосвязанных таблиц. Каждая строка такой таблицы называется записью,
а столбец – полем.

Реляционная модель данных имеет следующие свойства:

Каждый элемент таблицы – один элемент данных.

Все поля в таблице являются однородными, т.е. имеют один тип.

Каждое поле имеет уникальное имя.

Одинаковые записи в таблице отсутствуют.

Порядок записей в таблице может быть произвольным и может
характеризоваться количеством полей, типом данных.

Иерархическая модель

Иерархическая модель БД представляет собой совокупность элементов,
расположенных в порядке их подчинения от общего к частному и образующих
перевернутое дерево (граф). Данная модель характеризуется такими
параметрами, как уровни, узлы, связи. Принцип работы модели таков, что
несколько узлов более низкого уровня соединяются при помощи связи с
одним узлом более высокого уровня.

Узел – информационная модель элемента, находящегося на данном уровне
иерархии.

Свойства иерархической модели данных:

Несколько узлов низшего уровня связано только с одним узлом высшего
уровня.

Иерархическое дерево имеет только одну вершину (корень), не подчиненную
никакой другой вершине.

Каждый узел имеет свое имя (идентификатор).

Существует только один путь от корневой записи к более частной записи
данных.

Сетевая модель

Сетевая модель БД похожа на иерархическую. Она имеет те же основные
составляющие (узел, уровень, связь), однако характер их отношений
принципиально иной. В сетевой модели принята свободная связь между
элементами разных уровней.

Проблемы реляционного подхода

Можно доказать, что любую структуру данных можно преобразовать в простую
двухмерную таблицу. Такое представление является наиболее удобным и для
пользователя, и для машины, - подавляющее большинство современных
информационных систем работает именно с такими таблицами, т.е. с
реляционными базами данных.

Основная идея реляционного подхода состоит в том, чтобы представить
произвольную структуру данных в виде двухмерной таблицы, т.е.
нормализовать структуру.

Каждая запись в таблице должна иметь первичный ключ, т.е. идентификатор
(или адрес), значение которого однозначно определяет эту и только эту
запись. Первичный ключ должен обладать двумя свойствами.

Однозначная идентификация записи: запись должна однозначно определяться
значением ключа.

Отсутствие избыточности: никакое поле нельзя удалить из ключа, не
нарушая при этом свойства однозначной идентификации.

Каждое значение первичного ключа в пределах таблицы должно быть
уникальным. В противном случае невозможно отличить одну запись от
другой. Указание ключа – это единственный способ отличить одну запись от
другой. Обычно используют придуманные разработчиком уникальные цифровые
значения – код, табельные номера и т.д.

Кроме первичного, могут использоваться так называемые простые (или
вторичные) ключи таблицы. Простых ключей может быть множество. Они
используются при упорядочивании (индексировании) таблиц.

Нормализация

Мы уже говорили, что процесс превращения иерархической или сетевой
структуры данных в реляционную называется нормализацией. Внешне эта
операция очень проста, но содержит некоторые нюансы, игнорирование
которых может привести к неприятностям. Нюансы эти заключаются в том,
что даже для простых двухмерных структур приходится подправлять состав
полей.

Например, мы включим в таблицу поле, значение которого не зависит от
первичного ключа. В таком случае появляется возможность утери
информации. Однако важнее другое: повторяя многократно одни и те же
данные, мы не только переделаем массу лишней работы, но и неминуемо
ошибемся. Поэтому следует стремиться к исключению из таблицы полей,
которые не связаны непосредственно с первичным ключом таблицы. Для
этого, помимо оперативной, можно создать несколько справочных таблиц.
Оперативная таблица меняется часто, а справочники – редко, их легко
выправить раз и навсегда, внося в дальнейшем лишь небольшие изменения.

При проектировании таблиц рекомендуются следующие «золотые правила»:

Надо уяснить себе, что есть первичный ключ таблицы (т.е. убедиться, что
двух записей с одинаковым значением ключа в таблице быть не может)

Если первичный ключ не просматривается, подумать, правильно ли подобран
состав полей

Если первичный ключ безупречен, к нему можно дописывать любые атрибуты,
зависящие только от ключа.

Если при просмотре подготовленной БД в паре таблиц обнаружится
одноименное поле, которое не входит в первичный ключ ни одной из этих
таблиц, - это ошибка нормализации. Система не сможет контролировать
согласованность значений таких полей.

Достоверность информации

Поскольку первичное заполнение таблиц и ввод их в машину ведет человек,
ошибки в данных являются не исключением, а правилом, и любая ИС должна
иметь средство для диагностики и исправления ошибок.

Нарушение логической взаимосвязи – это логические (семантические)
ошибки, ошибки смысла, которые могут быть обнаружены аппаратом
формального логического контроля, построенным для ИС. Кроме того,
конкретная ИС может иметь собственные средства дополнительного
(«нестандартного») контроля, так как стандартные средства не могут
охватить все возможные случаи. В современных СУБД имеются средства
поддержания целостности данных. Кроме того, в современных ИС можно
указать условия, которым должны удовлетворять значения некоторых полей
(условия верификации данных).

Гораздо сложнее дело обстоит с ошибками в допустимых значениях данных.
Такие ошибки условно называются арифметическими, хотя это не совсем
точно, так как ошибочно может быть записано значение текстового данного:
например, Иванов И.П. вместо Иванов А.П. Существует ряд средств для
выявления арифметических ошибок, однако на пользовательском уровне
ограничиваются простым визуальным контролем.

Основы разработки базы данных

Прежде чем приступать к работе с базой данных, в первую очередь
необходимо выбрать модель представления данных. Она должна отвечать
следующим требованиям:

Наглядность представления информации;

Простота ввода информации;

Удобство поиска и отбора информации;

Возможность использования информации, введенной в другую базу;

Возможность быстрой перенастройки базы данных (добавление новых полей,
новых записей, их удаление).

При разработке БД можно выделить следующие этапы работы.

I этап. Постановка проблемы

На этом этапе формируется задание по созданию БД. В нем подробно
описывается состав базы, назначение и цели ее создания, а также
перечисляется, какие виды работ предполагается осуществлять в этой базе
данных (отбор, дополнение, изменение данных, печать или вывод отчета и
т.д.).

II этап. Анализ объекта

На этом этапе необходимо рассмотреть, из каких объектов может состоять
ваша БД, каковы свойства этих объектов. После разбиения БД на отдельные
объекты необходимо рассмотреть свойства каждого из этих объектов,
другими словами, установить, какими параметрами описывается каждый
объект. Все эти сведения можно располагать в виде отдельных записей и
таблиц. Далее необходимо рассмотреть тип данных каждой отдельной единицы
записи (текстовый, числовой и т.д.). Сведения о типах данных также
следует занести в составляемую таблицу.

III этап. Синтез модели

На этом этапе по проведенному выше анализу необходимо выбрать
определенную модель БД. Далее рассматриваются достоинства и недостатки
каждой модели, сопоставить их с требованиями и задачами вашей БД и
выбрать ту модель, которая сможет максимально обеспечить реализацию
поставленной задачи. После выбора модели необходимо нарисовать ее схему
с указанием связей между таблицами или узлами.

IV этап. Способы представления информации, программный инструментарий

После создания модели необходимо, в зависимости от выбранного
программного продукта, определить форму представления информации. В
большинстве СУБД данные можно хранить в двух видах:

С использованием форм;

Без использования форм.

Форма – созданный пользователем графический интерфейс для ввода данных в
базу.

V этап. Синтез компьютерной модели объекта и технология его создания