Парсинг Яндекс Книг и сравнение моей книги с другими

Присылают мне разного рода обратную связь относительно книги “Эффективное чтение”. Однако, в духе моего убеждения «не слушай, а наблюдай», я, конечно, внимательно читаю и слушаю отзывы, но при этом главным мерилом качества написанного остаются действия, которые совершают с книгой.

К действиям я отношу рекомендации (к сожалению, пока не знаю, как их измерить) и количество цитат, которые отмечают читатели. В этом плане мне очень нравится сервис «Яндекс Книги», где этот параметр максимально нагляден. Да, многие читатели публично не показывают, сколько и какие цитаты они отметили, а другие вообще ничего не отмечают, в то время как некоторые делают очень много пометок.

Но это типичный портрет читателя, и он относится ко всем книгам на сервисе. То есть, если подобное поведение проявляется в отношении одной книги, то с очень высокой вероятностью так же ведут себя и с другими.

С этой мыслью я решил изучить, насколько отношение «цитирования / читатели» у моей книги отличается от других на сервисе. Но как это сделать? Не просматривать же каждую отдельную книгу и выписывать данные вручную — занятие, мягко говоря, утомительное. Я решил спарсить книги.

Обратился к GPT и сказал, что хочу по книгам в категории «саморазвитие» (моя книга попала именно туда) собрать данные о количестве читателей и цитат. Полтора часа возился со скриптом, в итоге он получился вот таким — специалисты могут посмотреть и оценить, как GPT справился.

В итоге мы собрали 303 названия за пару минут. На 303-й книге сработало ограничение, которое я не знаю, как обойти: сервис Яндекса не выдаёт больше книг по категории, даже при бесконечном скролле.

В целом 303 книги для сравнения — это достаточная выборка, чтобы получить более-менее точную картину того, как моя книга «чувствует себя» в сравнении с другими. И вот что у меня получилось при анализе.

Первое, что я сделал, — вычистил таблицу от выбросов: книг с нереально высокими значениями отношения. Таких оказалось 15:

#TitleAuthor(s)ReadersQuotesRate
1Стоики побеждают: Ментальные тренировки для преодоления трудностейМаркос Васкес14,60039,2002.685
2Миссия выполнима. Технология счастливой жизниМаргулан Сейсембай18,60049,3002.651
3Хрупкие люди. Тайная дверь в мир нарциссовЮлия Пирумова31,70084,0002.650
4Счастливый карман, полный денегДэвид Кэмерон Джиканди64,900139,3002.146
5Из ничего: искусство создавать искусствоРик Рубин15,50030,6001.974
6Просто делай! Делай простоОскар Хартманн14,90027,2001.826
7Пять травм, которые мешают быть самим собойЛиз Бурбо39,40063,7001.617
8Под тенью СатурнаДжеймс Холлис17,40027,9001.603
9ОтветАллан Пиз, Барбара Пиз18,20029,1001.599
10Возвращение в кафеДжон Стрелеки23,30036,4001.562
11СепарацияВероника Хлебова15,70023,7001.510
12Бойся, я с тобойТаня Танк19,00026,8001.411
13Мирный воинДэн Миллмэн21,70029,9001.378
14Обретение смысла во второй половине жизниДжеймс Холлис14,20019,2001.352
15Метод ГарвардаВэй Сюин35,90048,4001.348

Почему у них такие значения, не знаю. Ни одну из этих книг я не читал, поэтому, если вы знакомы с ними, буду признателен, если поделитесь мыслями.

Дальше я заметил сильную связь между количеством читателей и количеством цитат: чем больше читателей, тем больше у книги будет цитат. Коэффициент Пирсона — 0,755. Среднее отношение цитат к читателям — 0,516, медиана — 0,402. 25% книг имеют значение ниже 0,208, а 75% — ниже 0,655.

А теперь внимание: у книги «Эффективное чтение» отношение — 1,103. Это почти в три раза выше медианы и более чем в два раза выше среднего.

Это подводит меня к четырём выводам относительно написанного мной:

  1. Книга написана доступным языком, но при этом глубина научной проработки достаточна, чтобы избежать как чрезмерной академичности, так и водянистости.
  2. Концепция «нечтения» оказалась достаточно оригинальной, чтобы привлечь внимание.
  3. Методологическая связность: планомерное продвижение от теории к практике с некоторыми «рывками» (например, необходимостью возвращаться от одной главы к другой) встряхивает читателя и побуждает более осмысленно взаимодействовать с книгой.
  4. Практическая плотность: материалы легко применимы, что делает цитирование высоким. Думаю ещё спарсить все цитаты и посмотреть, что же именно интересует читателей.

Как-то так.


BIO

🧠 theBrain mapping

ID: 202508110743 Source:: Friend:: Child:: Next::

Keywords:

Reference: