Понятие о файлах данных. Что такое расширение файла DATA? Что такое файлы данных

Урок №7

Разработка урока на тему «Файлы данных».

Тема урока: Файлы данных.

Цель урока: Сформировать у учащихся понятие о файле данных. Процедуры работы с файлами.

Задачи урока:

  1. Файлы данных.
  2. Процедуры работы с файлами.

Оборудование урока: компьютер, проектор.

План урока

1. Организационный момент (приветствие).

- Здравствуйте, садитесь. Кто сегодня отсутствует?

2. Изучение нового материала .

Файлы данных.

Файл данных - это пространство на магнитном носителе, зарезервированное для хранения информации и имеющее определенное имя. Файл - это также последовательность чисел (кодов), некоторые из которых понимаются как управляющие коды (например, существует код признака конца файла, для текстовых файлов существует признак конца строки). Что представляет из себя эта последовательность чисел можно решить только в программе. В самом файле нет никаких признаков, позволяющих определить характер информации.

Работать с файлом на физическом уровне крайне сложно. Поэтому для файла, как и для обычной переменной, Паскаль определяет тип. Например, можно записать:

a: file of integer; (Файл целых чисел.)

f: file of string; (Файл строк.)

Алгоритм работы с файлом:

  1. Файл специальной процедурой связывается с файловой переменной.
  1. Открывается либо создается файловая переменная (физически будет открыт файл, но программист в этом процессе не участвует).
  2. Выполняются необходимые операции чтения и записи данных.
  3. Файловая переменная закрывается.

Задача 1 . Напишем программу, в которой будут выполняться следующие действия:

  1. Открывается файл.
  2. Записывается 100 последовательных целых чисел.
  3. Файл закрывается.
  4. Файл открывается.
  5. Считываются числа, содержащиеся в файле, и распечатываются на экран.

Program example;

I,u: integer;

{ Определяется переменная, которую затем можно привязать к файлу,

F: file of integer;

begin

{ Файловая переменная привязывается к файлу,

Имя которого указано в апострофах }

Assign(f,’file’);

{ Так как такой файл еще не существует, то он создается и открывается}

Rewrite(f);

{ Числа записываются в файл }

For i:=1 to 100 do write(f,i);

{ Файл закрывается}

Close(f);

{ Так как файл уже существует, то он просто открывается }

Reset(f);

{ Числа читаются из файла и выводятся на экран дисплея}

For i:=1 to 100 do

Begin

Read(f,u);

Write(‘ ‘,u);

End;

end.

Файловая переменная не может быть совершенно обычной переменной. Поэтому для файловых переменных предусмотрены специальные процедуры и функции. Краткий список процедур и функций, работающих с файлами в Borland Pascal, приведен далее.

  1. assign - процедура, связывающая файл с файловой переменной.
  2. reset - открывает существующий файл и устанавливает указатель позиции файла на нулевой элемент.
  3. rewrite - создает файл.
  4. truncate - обрезает файл, начиная с текущей позиции.
  5. seek - устанавливает указатель файла в указанную позицию.
  6. eof - функция, возвращающая истину, если был достигнут конец файла, и ложь в противном случае.
  7. filesize - вычисляет размер файла в количестве записей того типа, который указан в объявлении файла.

Примечание

Для файла существует такое понятие как указатель на текущую позицию. Это величина целого типа (для Borland Pascal - это величина типа longint ), в которой хранится номер текущей позиции файла. При каждой операции чтения/записи указатель смещается на следующую запись. Под записью понимается длина типа, указанного в объявлении файла. Нумерация записей в файле начинается с нуля.

Структуры данных в приведенном примере определены вполне корректно, но в операторе write(f,a); компилятор выдаст сообщение об ошибке. А именно: компилятор сообщит, что имеет место несоответствие типов. Кажется, что типы переменных a и f одинаковы. Однако это не так с точки зрения компилятора. Мы описали две разные структуры, и компилятор справедливо полагает, что они могут быть различны и не берет на себя заботу по проверке их одинаковости.

Указанная проблема решается следующим образом:

Program example;

Uses crt;

Type

R=record

S:string;

I:integer;

End;

A:r;

F: file of r;

begin

A.s:="fsfsfsf";

A.i:=8;

Write(f,a);

end.

Эта программа реализует ту же задачу, что и предыдущая, однако здесь для компилятора не возникает никаких проблем.

Файл может быть компонентом сложной структуры. Например, вполне допустим массив файлов:

f:array file of integer;

Файл вполне может оказаться компонентом записи:

Program example;

A:record

S:string;

F: file of integer;

End;

begin

Assign(a.f,"file.dat");rewrite(a.f);

end.

В этом примере открывается файл массивов. То есть каждая запись файла - это массив длиной в 10 целых чисел. Причем мы можем не определять значения всех десяти элементов, в файле все равно будет записано их десять, как дано в определении массива.

Один и тот же физический файл можно открыть как файл одного типа, а затем его же как файл другого типа:

Program example; Uses crt;

S:string;

I:integer;

F:file of string;

D:file of integer;

begin

Clrscr;

Assign(f,"file.dat");rewrite(f);

S:="gdgdgjagdjasg";

For i:=1 to 10 do write(f,s);

Close(f);

Assign(d,"file.dat");reset(d);

While not eof(d) do

Begin

Read(d,i);write(i," ");

End;

end.

В этом примере файл с именем file.dat открывается как строковый и заполняется некоторым содержимым, затем закрывается и опять открывается, но уже как файл чисел. Такие операции для языка Паскаль вполне законны, это следствие того, что на физическом уровне тип файла никак не фиксируется.

Заключение: Файл - это структура позволяющая хранить большие наборы информации. То, что файловые типы представляют собой обычные языковые типы данных, добавляет им удобства в обработке. Единственный недостаток хранения данных в файлах - это относительно низкая скорость доступа.

3.Домашнее задание.

Повторить изученный материал. Выучить основные понятия: файл данных; файл; алгоритм работы с файлами; процедуры и функции, работающие с файлами; запись.

4. Подведение итогов

Выставление оценок ученикам, которые хорошо работали на уроке.


Данные в компьютере хранятся в файлах. Файл является основной структурной единицей организации и хранения данных в компьютере. Существует достаточно много определений понятия файла, сущность которых сводится к следующему: файл есть определенное количество информации (файл может содержать компьютерную программу, текстовый документ, числовые данные, закодированный рисунок и т. д.), имеющее имя и хранящееся на внешнем ЗУ. Имя файла состоит из двух частей, разделенных точкой: первая часть это непосредственно имя файла, вторая – его расширение, определяющее его тип, т. е. то, что хранится в конкретном файле (компьютерная программа, графические данные и т. д.). Имя файлу присваивает пользователь (если пользователь по каким-то причинам не назначает имя файла, то компьютерная программа после завершения работы сама назначит имя по умолчанию), а тип файла может задаваться принудительно пользователем или приложением (компьютерной программой) автоматически при его создании. В табл. 6.2 приведены некоторые типы файлов и соответствующие им расширения, звездочкой обозначены возможные имена файлов.

Таблица 6.2

Кроме имени файла существует такое понятие, как «формат файла», который определяет способ хранения информации (структуру данных) в файле и отображения файла на экране или при печати. Формат файла определяет правила написания имен файлов и зависит от файловой системы, поддерживаемой операционной системой (ОС), установленной на компьютере. Например, в ОС MS DOS имя файла должно содержать не более восьми букв латинского алфавита, а расширение состоит из трех латинских букв – primer.txt, prim.txt, priml.txt и т. д. В ОС семейства Windows имя файла может иметь до 255 символов, при этом можно использовать и русский алфавит – album, jpg, пример. сюс и т. д. Эти правила в ОС MS DOS и ОС семейства Windows запрещают при назначении имен файлов использовать следующие знаки и символы: / \: *? < >|.

На любом из вышеперечисленных внешних ЗУ может храниться большое количество файлов. Порядок ихранения определяется файловой системой, которая может иметь определенную файловую структуру. Каждому имени файла соответствует свой уникальный адрес, что позволяет МП при необходимости находить на внешнем ЗУ нужный файл, а затем считывать из него данные в ОЗУ. Файлы в операционных системах по функциональному или тематическому признаку могут объединяться в каталоги или папки, которые в свою очередь могут входить в другие каталоги или папки, т. е. иметь сложную файловую структуру.

вполне закономерен.

Файл - это последовательная цепочка набора данных, которая имеет название и расширение (расширение может отсутствовать - в таком случае Windows будет воспринимать файл неопределяемым). Файл это информационная сущность, поэтому он хранится на физическом носителе (жестком диске, флешке и так далее). Для того, чтобы файл можно было полноценно идентифицировать, полное имя файла, состоящее из имени, точки и расширения (последовательность именно такая), должно быть уникальными в рамках одного хранилища (в терминологии Windows каталога). Расширение файла позволяет системе определить какие из программ могут корректно открывать, запускать, считывать и использовать данный файл.

Стоит знать, что каталог это такой же файл, но со специфическими особенностями. В отличии от обычных файлов, он не может содержать данные, однако может включать в себя файлы или другие каталоги. Аналогично документам в архивах. Есть папки, внутри которых лежат листочки (файлы). А есть более толстые папки, внутри которых лежат другие каталоги.

Рассмотрим пример. Файл "document.doc". Здесь "document" это имя файла, а "doc" это расширение, которое указывает Windows, что данный файл необходимо открывать и редактировать с помощью текстовых процессоров, таких как Microsoft Word или OpenOffice Writer. В случае если расширение не известно Windows (не установлено необходимых программ), то система предложит выбрать программу вручную. Стоит знать, что в Windows есть предопределенные наборы известных расширений, таких как txt (текстовый файл), exe (исполняемая программа) и прочие.

Классификация файлов по функциональному применению

Все разнообразие типов файлов принято делить по их функциональному применению. Это не является обязательным критерием, однако позволяет легче понимать назначение файлов. Кроме того, важно знать, что классификация по функциональному применению никак не ограничивает набор расширений. Например, каждый из классов может содержать архивы, документы, исполняемые файлы и прочее.

1. Файлы пользователя - рисунки, веб-страницы, документы, таблицы и прочие файлы, которые пользователи используют для собственных задач. Имена таких файлов ограничены лишь стандартом имен Windows. Расширения таких файлов обычно не задаются пользователями, а автоматически проставляются используемыми программами, во время создания файлов. Например, программа Microsoft Word выставляет расширение "doc" или "docx" (в зависимости от версии), а OpenOffice Writer устанавливает "odt".

2. Системные файлы - все файлы, которые необходимы Windows для нормального функционирования. Имена таких файлов так же не противоречат стандарту имен Windows, однако они предопределены еще до установки операционной системы. Поэтому такие файлы нельзя переименовывать или изменять пользователям, так как это чревато возникновением ошибок.

3. Программные файлы - все те файлы, которые используются установленным программным обеспечением. С точки зрения формирования имени, они аналогичны системным файлам. Другими словами, так же не противоречат стандарту имен, но имеют фиксированные имена, которые были определены автором. Стоит знать, что программы могут так же создавать программные файлы во время своего функционирования. Например, файлы журнала ошибок или файлы конфигурации. Эти файлы должны редактироваться только самой программой, в противном случае могут возникать ошибки (при условии, что программное обеспечение не предусматривает обратного).

Стандарт имен файлов в операционной системе Windows.

Рассмотрим стандарт имен файлов в операционной системе Windows. Имеется два набора символов:

1. Рекомендуемый набор символов . В имени файлов допускается использование цифр, символов латинского, русского и любых других национальных алфавитов. Так же поддерживается знак дефис. Все буквы языков можно писать в разных регистрах (верхний и нижний).

2. Допустимый набор символов . Сюда входит пробел, подчеркивание, апостроф, точка с запятой, точка, запятая, а так же специальные символы " ! @ # $ % & " (и часть специальных символов основной кодировки). Стоит знать, что этот набор символов интерпретируется Windows специфически. Поэтому по возможности не стоит их применять. Тем не менее, с символами пробела, точки, запятой и подчеркивания редко возникают проблемы. А вот при использовании остальных символов могут возникать ошибки. Особенно, с некоторыми спецсимволами. Так же стоит знать, что если вам нужны файлы, которые будут нормально открываться и в других операционных системах, то стоит ограничиваться только цифрами и латинским алфавитом, а точку использовать только для разделения имени и расширения.

Запрещенный набор символов - в именах файлов нельзя использовать: \ /: * ? < > |

Что такое файл в графическом интерфейсе ? Windows имеет собственную графическую оболочку, которая позволяет пользователям взаимодействовать с компьютером. В этом интерфейсе файлы показываются в виде небольших изображений, которые так же еще называют иконками или значками, и имени с расширением (при определенных настройках расширения файлов не отображаются). Обычно, если тип расширения известен Windows, то иконка такого файла будет специфической. Например, текстовые файлы с расширением "txt" обычно представлены значком блокнота.

Как формируется полный путь до файла . У компьютера есть диски, они представлены латинской буквой. Это первая составляющая пути. После нее ставится разделитель в виде двоеточия и косой черты ":\". В случае если файл лежит в корне диска, то далее идет полное имя файла (далее по тексту просто имя файла). Если же файл лежит в каталоге, вначале указывается имя каталога, затем ставится символ "\" и указывается имя файла. Если же файл находится в подкаталоге каталога, то после каталога так же должно идти имя подкаталога и "\". Далее по аналогии. В данном случае символ "\" является разделителем, который позволяет идентифицировать каждую часть полного пути до файла.

Файл данных MathCAD11 должен быть просто файлом в ASCII-формате. MathCAD11 читает файлы, которые состоят из чисел, отделяемых запятыми, пробелами или возвратами каретки. Ниже описаны примеры некоторых файлов, читаемых в MathCAD11, в предположении, что они записаны в ASCII-формате:

§ файл, созданный выводом данных из электронной таблицы на диск;

§ столбец чисел, набитых в текстовом процессоре и сохраненных в ASCII- формате;

§ результат работы программы, написанной на языке высокого уровня;

§ данные, экспортированные из базы данных.

Числа в файлах данных могут быть целыми числами, подобными 3 или -1, числами с плавающей запятой, подобными 2.54, или иметь экспоненциальную запись, как 4.51E -4 (для 4.5 10 -4). Например, следующий список чисел был бы допустимой строкой в файле данных MathCAD11:

200, 50 25.1256, 16E – 2, – 16.125E15

MathCAD11 также сохраняет данные в ASCII-файлы. Файлы данных, сохранённые MathCAD11, содержат числа, отделяемые пробелами и возвратами каретки. Документы MathCAD11 сами по себе не являются файлами данных в указанном понимании. Единственный способ создать файл данных из MathCAD11 - использование функций доступа к файлам.

Функции доступа к файлам

В MathCAD11 есть шесть функций доступа к файлам READ, WRITE , APPEND , READPRN , WRITEPRN , APPENDPRN . Их свойства:

§ Имя функции должно печататься заглавными буквами;

§ Если MathCAD11 не может найти файл данных, он отмечает соответствующую функцию доступа сообщением об ошибке “файл не найден ”. Если MathCAD11 пытается прочитать файл неподходящего формата, он отмечает функцию сообщением “ошибка файла ”;

§ Левая часть оператора присваивания, использующего одну из функций WRITE , APPEND , WRITEPRN, APPENDPRN , не должна больше ничего содержать;

§ Каждое новое равенство с использованием функций доступа заново открывает файл данных. При считывании данных, например, каждое новое равенство начинает читать в начале файла;

§ В одном равенстве файл может быть открыт только единожды. Это означает, что, если функция READ используется с одним аргументом-именем файла дважды в одном уравнении (это возможно при использовании дискретного аргумента), во второй раз READ начнет читать с того места, где закончилось чтение в первый раз. Поскольку READPRN читает весь файл целиком, это означает, что READPRN нельзя использовать с одним аргументом дважды в одном равенстве - во второй раз READPRN не останется ничего читать;

§ Если два равенства в рабочем документе используют WRITE или WRITEPRN с одним аргументом, данные из второго равенства запишутся поверх данных из первого. Следует использовать APPEND или APPENDPRN, если нужно сохранить первую порцию данных. Эти функции дописывают новые данные к существующему файлу.

В табл. 6.1 описаны эти шесть функций.

Таблица 6.1

Функции доступа к файлам

Функция Значение
READ(file ) Считывает значение из файла данных. Возвращает скаляр. Обычно используется следующим образом: v i:=READ(“file” )
WRITE(file ) Записывает значение в файл данных. Если файл уже существует, заменяет его на новый файл. Используется в определениях следующего вида: WRITE(file ) := v i
APPEND(file ) Дописывает значение к существующему файлу. Используется в определениях следующего вида: APPEND(file ) := v i
READPRN(file ) Читает структурированный файл данных. Возвращает матрицу. Каждая строка в файле данных становится строкой в матрице. Число элементов в каждой строке должно быть одинаковым. Обычно используется следующим образом: A: = READPRN(file )

Окончание табл.6.1

You"re here because you have a file that has a file extension ending in .data. Files with the file extension .data can only be launched by certain applications. It"s possible that .data files are data files rather than documents or media, which means they"re not meant to be viewed at all.

what is a .data file?

Files saved in the DATA format are used by the Analysis Studio software, and this application stores in these DATA files the details used for offline analysis. This data can be entered into the associated DATA file by an Analysis Studio user. Generally classified as data files, these DATA files are affixed with the .data extension and are more specifically called Analysis Studio offline data files. Appricon developed the DATA format and the Analysis Studio software to provide users with offline data storage and analytical functionalities helpful instatistical data research, storage, management and analysis. The content of these DATA files can include data encoded in plain text or in tab-delimited formats. Analysis Studio file headers may also be included in these DATA files by Analysis Studio users. A user disconnected from an Analysis Studio server usually accesses these DATA files in offline mode, though the Analysis Studio software also provides user access to the content of these DATA files even in online mode. The content of these DATA files may also be imported from other databases like Microsoft SQL Server and Microsoft Access databases. The Analysis Studio software associates a DATA file to a corresponding STP file, and the content of these STP files is comprised of object metadata and project schema details. A Microsoft Windows user can remove the Analysis Studio header file of the DATA file to open and view its content using the Microsoft Excel 2010 spreadsheet application.

how to open a .data file?

Launch a .data file, or any other file on your PC, by double-clicking it. If your file associations are set up correctly, the application that"s meant to open your .data file will open it. It"s possible you may need to download or purchase the correct application. It"s also possible that you have the correct application on your PC, but .data files aren"t yet associated with it. In this case, when you try to open a .data file, you can tell Windows which application is the correct one for that file. From then on, opening a .data file will open the correct application.

applications that open a .data file

Appricon Analysis Studio

Appricon Analysis Studio

Anaysis studio developed by Appricon is a data mining and statistical tool that has automated regression modeling methods which can be used to gain higher levels of accurateness and stability. This software was developed to support important and critical decisions in Web mining, marketing, customer analytics, credit scoring, health science and human resources. For optimal performance, it features cross tab tables in which multiple statistical measurements can be viewed graphically, it has cox regression, multiple regressions optimization, trend factors optimization, a built-in sensitivity and built-in what-if for all kinds of regression, auto correlation wizard, it also features survival modeling, and for optimum model performance, it has logistic regression and fractional polynomials, it also includes time series and forecasting wizards, more than 25 charts, for quick forecasting optimizations it has seasonality detector, multi core computations, regression analysis which features various model comparison and analysis, and a quick deep logistic regression for model development and deployment. Analysis studio has a distinct feature which lets its users use various data sources from different vendors using the same project without the hassle of writing codes, this includes the MSSQL, Oracle, MSExcel, MSAccess, text and xml files. This software features a 500 rows per data set limitation but with an unlimited number of variables.

a word of warning

Be careful not to rename the extension on .data files, or any other files. This will not change the file type. Only special conversion software can change a file from one file type to another.