Парсинг Яндекс Книг и сравнение моей книги с другими
Присылают мне разного рода обратную связь относительно книги “Эффективное чтение”. Однако, в духе моего убеждения «не слушай, а наблюдай», я, конечно, внимательно читаю и слушаю отзывы, но при этом главным мерилом качества написанного остаются действия, которые совершают с книгой.
К действиям я отношу рекомендации (к сожалению, пока не знаю, как их измерить) и количество цитат, которые отмечают читатели. В этом плане мне очень нравится сервис «Яндекс Книги», где этот параметр максимально нагляден. Да, многие читатели публично не показывают, сколько и какие цитаты они отметили, а другие вообще ничего не отмечают, в то время как некоторые делают очень много пометок.
Но это типичный портрет читателя, и он относится ко всем книгам на сервисе. То есть, если подобное поведение проявляется в отношении одной книги, то с очень высокой вероятностью так же ведут себя и с другими.
С этой мыслью я решил изучить, насколько отношение «цитирования / читатели» у моей книги отличается от других на сервисе. Но как это сделать? Не просматривать же каждую отдельную книгу и выписывать данные вручную — занятие, мягко говоря, утомительное. Я решил спарсить книги.
Обратился к GPT и сказал, что хочу по книгам в категории «саморазвитие» (моя книга попала именно туда) собрать данные о количестве читателей и цитат. Полтора часа возился со скриптом, в итоге он получился вот таким — специалисты могут посмотреть и оценить, как GPT справился.
В итоге мы собрали 303 названия за пару минут. На 303-й книге сработало ограничение, которое я не знаю, как обойти: сервис Яндекса не выдаёт больше книг по категории, даже при бесконечном скролле.
В целом 303 книги для сравнения — это достаточная выборка, чтобы получить более-менее точную картину того, как моя книга «чувствует себя» в сравнении с другими. И вот что у меня получилось при анализе.
Первое, что я сделал, — вычистил таблицу от выбросов: книг с нереально высокими значениями отношения. Таких оказалось 15:
# | Title | Author(s) | Readers | Quotes | Rate |
---|---|---|---|---|---|
1 | Стоики побеждают: Ментальные тренировки для преодоления трудностей | Маркос Васкес | 14,600 | 39,200 | 2.685 |
2 | Миссия выполнима. Технология счастливой жизни | Маргулан Сейсембай | 18,600 | 49,300 | 2.651 |
3 | Хрупкие люди. Тайная дверь в мир нарциссов | Юлия Пирумова | 31,700 | 84,000 | 2.650 |
4 | Счастливый карман, полный денег | Дэвид Кэмерон Джиканди | 64,900 | 139,300 | 2.146 |
5 | Из ничего: искусство создавать искусство | Рик Рубин | 15,500 | 30,600 | 1.974 |
6 | Просто делай! Делай просто | Оскар Хартманн | 14,900 | 27,200 | 1.826 |
7 | Пять травм, которые мешают быть самим собой | Лиз Бурбо | 39,400 | 63,700 | 1.617 |
8 | Под тенью Сатурна | Джеймс Холлис | 17,400 | 27,900 | 1.603 |
9 | Ответ | Аллан Пиз, Барбара Пиз | 18,200 | 29,100 | 1.599 |
10 | Возвращение в кафе | Джон Стрелеки | 23,300 | 36,400 | 1.562 |
11 | Сепарация | Вероника Хлебова | 15,700 | 23,700 | 1.510 |
12 | Бойся, я с тобой | Таня Танк | 19,000 | 26,800 | 1.411 |
13 | Мирный воин | Дэн Миллмэн | 21,700 | 29,900 | 1.378 |
14 | Обретение смысла во второй половине жизни | Джеймс Холлис | 14,200 | 19,200 | 1.352 |
15 | Метод Гарварда | Вэй Сюин | 35,900 | 48,400 | 1.348 |
Почему у них такие значения, не знаю. Ни одну из этих книг я не читал, поэтому, если вы знакомы с ними, буду признателен, если поделитесь мыслями.
Дальше я заметил сильную связь между количеством читателей и количеством цитат: чем больше читателей, тем больше у книги будет цитат. Коэффициент Пирсона — 0,755. Среднее отношение цитат к читателям — 0,516, медиана — 0,402. 25% книг имеют значение ниже 0,208, а 75% — ниже 0,655.
А теперь внимание: у книги «Эффективное чтение» отношение — 1,103. Это почти в три раза выше медианы и более чем в два раза выше среднего.
Это подводит меня к четырём выводам относительно написанного мной:
- Книга написана доступным языком, но при этом глубина научной проработки достаточна, чтобы избежать как чрезмерной академичности, так и водянистости.
- Концепция «нечтения» оказалась достаточно оригинальной, чтобы привлечь внимание.
- Методологическая связность: планомерное продвижение от теории к практике с некоторыми «рывками» (например, необходимостью возвращаться от одной главы к другой) встряхивает читателя и побуждает более осмысленно взаимодействовать с книгой.
- Практическая плотность: материалы легко применимы, что делает цитирование высоким. Думаю ещё спарсить все цитаты и посмотреть, что же именно интересует читателей.
Как-то так.
BIO
🧠 theBrain mapping
ID: 202508110743 Source:: Friend:: Child:: Next::
Keywords:
Reference: