Я хочу создать базу данных, в которой будут храниться... содержание книг. Чтобы потом можно было производить поиск по ключевым словам и фразам. Объем достаточно большой.
Есть ли вообще смысл в хранении книг в БД? Потянет ли MySQL для этих целей?
Если нет, то какой еще может быть способ хранения с возможностью поиска по всем книгам?
SQL
Можно ли хранить книги в МуSQL
Думаю можно, а вот то, что справиться... даже не скажу, если распределенные сервера... то возможно много загнать.
Заводишь таблицу слов русского языка, где-то 300000 будет или не важно какого языка, просто слова пихать в эту таблицу. Тогда книга 3000 знаков на лист или примерно 900000 символов, где-то 150000 слов-ссылок на таблицу всех возможных слов, что будет 150 килобайт на книгу. Индекс по этим ссылкам. Тогда можно спокойно найти по всем ключевым словам просто ища номер слова в таблице всех возможных слов.
Вот алгоритм поиска по фразам сложнее делать, особенно длинные, не знаю даже на сколько быстра будет эта система.
Заводишь таблицу слов русского языка, где-то 300000 будет или не важно какого языка, просто слова пихать в эту таблицу. Тогда книга 3000 знаков на лист или примерно 900000 символов, где-то 150000 слов-ссылок на таблицу всех возможных слов, что будет 150 килобайт на книгу. Индекс по этим ссылкам. Тогда можно спокойно найти по всем ключевым словам просто ища номер слова в таблице всех возможных слов.
Вот алгоритм поиска по фразам сложнее делать, особенно длинные, не знаю даже на сколько быстра будет эта система.
учите какой-нить full text search engine
при засовывании книги в базу (и если у вас есть реально текст книги, а не фотокопия), генерите список ключевых слов.
и храните это дело в базе... саму же книгу можете хранить в любом удобном вам виде... в каком-нить "блобе"
кажется нам в "школьную пору" давали задание состряпать что-то типа "википедии"
функция поиска само собой была. разве что мы не сохраняли никаких книг...
при засовывании книги в базу (и если у вас есть реально текст книги, а не фотокопия), генерите список ключевых слов.
и храните это дело в базе... саму же книгу можете хранить в любом удобном вам виде... в каком-нить "блобе"
кажется нам в "школьную пору" давали задание состряпать что-то типа "википедии"
функция поиска само собой была. разве что мы не сохраняли никаких книг...
А что Вы понимаете под "достаточно большой"? :)
А если без шуток, то выбор реально зависит от объема данных, которые Вы хотите хранить. С точки зрения чистой инженерии правильнее было бы хранить толстые документы в специально под это заточенных базах данных (Cassandra, Couchbase, MongoDB), но у них минимальные требования к аппаратному обеспечению такие, что мало не покажется...
А если без шуток, то выбор реально зависит от объема данных, которые Вы хотите хранить. С точки зрения чистой инженерии правильнее было бы хранить толстые документы в специально под это заточенных базах данных (Cassandra, Couchbase, MongoDB), но у них минимальные требования к аппаратному обеспечению такие, что мало не покажется...
Kgz Б.а.л.а.
Дело в том, что их нужно выкладывать в интернет. Упомянутые вами БД подойдут для этих целей?
ИМХО абсолютно нет смысла. Храните их в виде файлов: PDF или HTML, удобно для чтения, и + заведите базу, где будут ссылки на файлы. А для поиска, напишите отдельную программу, на любом языке, где есть библиотеки для PDF или HTML.
dev.mysql.com/doc/refman/5.0/en/string-type-overview.html
средняя книга 300-400тыс. знаков, в MEDIUMTEXT точно влезет, даже не средняя и без всяких проблем.
средняя книга 300-400тыс. знаков, в MEDIUMTEXT точно влезет, даже не средняя и без всяких проблем.
Олег Михалин
Стопудово не катит в случае с богато иллюстрированными книгами. И вообще, любое решение, в котором объём единицы хранения ограничен, в наше время стоит с негодованием отметать. :)
Похожие вопросы
- Как в одной записи таблицы хранить несколько полей одного типа (не фиксированное число)?
- Как ВК хранит фотографии?
- Можно ли дома хранить книгу мертвых с египта?
- Можно ли хранить книги, обернув пищевой пленкой?
- Как правильно хранить книги: стоя или лёжа
- зачем нужно хранить книги, которые ни когда не собираешься читать? я читаю только в электронном виде,
- Вредно ли хранить книги в целлофане?
- Если дома хранить книги по оккультизму, это плохо? Сейчас желание такое- сжечь их) Ни чего страшного не будет?
- Как хранить книги?
- можно ли в спальне хранить книги-ужастики?