• setoutputsize(size[, column]) Устанавливает размер буфера для выходного параметра из столбца с номером column. Если column не задан, метод устанавливает размер для всех больших выходных параметров. Может использоваться, например, для получения больших бинарных объектов (Binary Large Object, BLOB).
DB-API 2.0 предусматривает названия для объектов–типов, используемых для описания полей базы данных:
Объект Тип STRING Строка и символ BINARY Бинарный объект NUMBER Число DATETIME Дата и время ROWID Идентификатор записи None NULL–значение (отсутствующее значение)
С каждым типом данных (в реальности это — классы) связан конструктор. Совместимый с DB-API модуль должен определять следующие конструкторы:
• Date(год, месяц, день) Дата.
• Time(час, минута, секунда) Время.
• Timestamp(год, месяц, день, час, минута, секунда) Дата–время.
• DateFromTicks(secs) Дата в виде числа секунд secs от начала эпохи (1 января 1970 года).
• TimeFromTicks(secs) Время, то же.
• TimestampFromTicks(secs) Дата–время, то же.
• Binary(string) Большой бинарный объект на основании строки string.
Работа с базой данных из Python–приложения
Далее в лекции на конкретных примерах будет показано, как работать с базой данных из программы на языке Python. Нужно отметить, что здесь не ставится цели постичь премудрости языка запросов (это тема отдельного курса). Простые примеры позволят понять, что при программировании на Python доступ к базе данных не сложнее доступа к другим источникам данных (файлам, сетевым объектам).
Именно поэтому для демонстрации выбрана СУБД SQLite, работающая как под Unix, так и под Windows. Кроме установки собственно SQLite (сайт http://sqlite.org) и модуля сопряжения с Python (http://pysqlite.org), каких–либо дополнительных настроек проводить не требуется, так как SQLite хранит данные базы в отдельном файле: сразу приступать к созданию таблиц, занесению в них данных и произведению запросов нельзя. Выбранная СУБД (в силу своей «легкости») имеет одну существенную особенность: за одним небольшим исключением, СУБД SQLite не обращает внимания на типы данных (она хранит все данные в виде строк), поэтому модуль расширения sqlite для Python проделывает дополнительную работу по преобразованию типов. Кроме того, СУБД SQLite поддерживает достаточно большое подмножество свойств стандарта SQL92, оставаясь при этом небольшой и быстрой, что немаловажно, например, для web–приложений. Достаточно сказать, что SQLite поддерживает даже транзакции.
Еще раз стоит повторить, что выбор учебной базы данных не влияет на синтаксис использованных средств, так как модуль sqlite, который будет использоваться, поддерживает DB-API 2.0, а значит, переход на любую другую СУБД потребует минимальных изменений в вызове функции connect() и, возможно, использования более удачных типов данных, свойственных целевой СУБД.
Схематично работа с базой данных может выглядеть примерно так:
• Подключение к базе данных (вызов connect() с получением объекта–соединения).
• Создание одного или нескольких курсоров (вызов метода объекта–соединения cursor() с получением объекта–курсора).
• Исполнение команды или запроса (вызов метода execute() или его вариантов).
• Получение результатов запроса (вызов метода fetchone() или его вариантов).
• Завершение транзакции или ее откат (вызов метода объекта–соединения commit() или rollback()).
• Когда все необходимые транзакции произведены, подключение закрывается вызовом метода close() объекта–соединения.
Допустим, программное обеспечение установлено правильно, и можно работать с модулем sqlite. Стоит посмотреть, чему будут равны константы:
>>> import sqlite
>>> sqlite.apilevel
'2.0'
>>> sqlite.paramstyle
'pyformat'
>>> sqlite.threadsafety
1
Отсюда следует, что sqlite поддерживает DB-API 2.0, подстановка параметров выполняется в стиле строки форматирования языка Python, а соединения нельзя совместно использовать из различных потоков управления (без блокировок).
Для создания базы данных нужно установить, какие таблицы (и другие объекты, например индексы) в ней будут храниться, а также определить структуры таблиц (имена и типы полей).
Задача — создание базы данных, в которой будет храниться телепрограмма. В этой базе будет таблица со следующими полями:
• tvdate,
• tvweekday,
• tvchannel,
• tvtime1,
• tvtime2,
• prname,
• prgenre.
Здесь tvdate — дата, tvchannel — канал, tvtime1 и tvtime2 — время начала и конца передачи, prname — название, prgenre — жанр. Конечно, в этой таблице есть функциональная зависимость (tvweekday вычисляется на основе tvdate и tvtime1), но из практических соображений БД к нормальным формам приводиться не будет. Кроме того, таблица будет создана с названиями дней недели (устанавливает соответствие между номером дня и днем недели):
• weekday,
• wdname.
Следующий сценарий создаст таблицу в базе данных (в случае с SQLite заботиться о создании базы данных не нужно: файл создастся автоматически. Для других баз данных необходимо перед этим создать базу данных, например, SQL–инструкцией CREATE DATABASE):
import sqlite as db
c = db.connect(database="tvprogram")
cu = c.cursor()
try:
cu.execute("""
CREATE TABLE tv (
tvdate DATE,
tvweekday INTEGER,
tvchannel VARCHAR(30),
tvtime1 TIME,
tvtime2 TIME,
prname VARCHAR(150),
prgenre VARCHAR(40)
);
""")
except db.DatabaseError, x:
print "Ошибка: ", x
c.commit()
try:
cu.execute("""
CREATE TABLE wd (
weekday INTEGER,
wdname VARCHAR(11)
);
""")
except db.DatabaseError, x:
print "Ошибка: ", x
c.commit()
c.close()
Здесь просто исполняются SQL–инструкции, и обрабатывается ошибка базы данных, если таковая случится (например, при попытке создать таблицу с уже существующим именем). Для того чтобы таблицы создавались независимо, используется commit().
Кстати, удалить таблицы из базы данных можно следующим образом:
import sqlite as db
c = db.connect(database="tvprogram")
cu = c.cursor()
try:
cu.execute("""DROP TABLE tv;""")
except db.DatabaseError, x:
print "Ошибка: ", x
c.commit()
try:
cu.execute("""DROP TABLE wd;""")
except db.DatabaseError, x:
print "Ошибка: ", x
c.commit()
c.close()
Теперь можно наполнить таблицы значениями. Следует начать с расшифровки числовых значений для дней недели:
weekdays = ["Воскресенье", "Понедельник", "Вторник", "Среда",
"Четверг", "Пятница", "Суббота", "Воскресенье"]
import sqlite as db
c = db.connect(database="tvprogram")
cu = c.cursor()
cu.execute("""DELETE FROM wd;""")
cu.executemany("""INSERT INTO wd VALUES (%s, %s);""",
enumerate(weekdays))
c.commit()
c.close()
Стоит напомнить, что встроенная функция enumerate() создает список пар номер–значение, например:
>>> print [i for i in enumerate(['a', 'b', 'c'])]
[(0, 'a'), (1, 'b'), (2, 'c')]
Из приведенного примера ясно, что метод executemany() объекта–курсора использует второй параметр — последовательность — для массового ввода данных с помощью SQL–инструкции INSERT.
Предположим, что телепрограмма задана в файле tv.csv в формате CSV (он уже обсуждался):
10.02.2003 9.00|ОРТ|Новости|Новости|9.15
10.02.2003 9.15|ОРТ|"НЕЖНЫЙ ЯД"|Сериал|10.15
10.02.2003 10.15|ОРТ|"Маски–шоу"|Юмористическая программа|10.45
10.02.2003 10.45|ОРТ|"Человек и закон"||11.30
10.02.2003 11.30|ОРТ|"НОВЫЕ ПРИКЛЮЧЕНИЯ СИНДБАДА"|Сериал|12.00
Следующая программа разбирает CSV–файл и записывает данные в таблицу tv:
import calendar, csv
import sqlite as db
from sqlite.main import Time, Date ## Только для
db.Date, db.Time = Date, Time ## sqlite
c = db.connect(database="tvprogram")