Как увидеть эпидемию, если её старательно прячут. Опыт пяти российских регионов
Не надо обманываться. Ничего не закончилось.
Давайте покажу (и расскажу), как выглядит эпидемия в регионе, давно и успешно победившем коронавирус. 18 мая этот регион «вышел на плато», а две недели назад перешёл на второй этап снятия ограничений. Этот регион последний месяц уверенно держится между 32 и 42 случаями — здесь ни разу не выявили ни больше, ни меньше. С 1 июня здесь не было более 54 заражений за день. При этом, сразу по нескольким признакам, именно в июне здесь и началась настоящая эпидемия.
Это Татарстан — благополучная и небедная республика. И именно здесь заболели близкие мне люди. Поэтому в ближайших постах у меня будут не только цифры, графики и чужие свидетельства. Будет и личный опыт, в котором намешалось всякое: очереди в поликлиниках по 4 часа, ожидание скорой по 14 часов, отказы в тестах, отказы в госпитализации при подтверждённой вирусной пневмонии людям из группы риска, и прочая.
О том, что происходит (происходило) в Татарстане — от первого лица — в следующем посте. Сегодня — скучный анализ, который покажет, почему я вообще считаю, что настоящая эпидемия здесь началась только в июне.
Но это пост не только про Татарстан. Пост про общую методику, с помощью которой можно выяснить, что в регионе прямо сейчас — эпидемия. Про то, как оценить её динамику, если нет доверия официальной статистике, и как понять ситуацию в регионе: он растёт или падает? Татарстан здесь — просто наглядная иллюстрация, очень характерный пример обычного российского региона, в который вдруг пришёл ковид.
Ниже — Татарстан, Москва и Дагестан. Под конец будут Алтайский край и Петербург. Все регионы разные, но их объединяет одно: одинаковая динамика поисковых запросов, по которой можно восстановить реальный ход эпидемии. Поисковые запросы — один из способов увидеть эпидемию там, где она скрыта за туманом войны, а официальные цифры не отражают реальности (или в этом есть сомнения).
Сразу два дисклеймера. Первый: ниже — статистика поисковых систем и исключительно мои наблюдения над этой статистикой, предположения и немного личного опыта. Я не претендую на правду — я пытаюсь её отыскать. Я ищу сигналы — но я не берусь утверждать, что они на 100% достоверны. Мои исходные посылки могут быть неверны, я могу ошибаться в интерпретациях и делать ошибочные выводы — я не утверждаю, что всё правда. Но все цифры, которые я привожу,правдивы, и основаны на общедоступной статистике (ниже я даю исходные сырые данные для перепроверки).
Второй: мой метод не оригинален, я его подсмотрел в начале мая у Бориса Овчичнникова — советую почитать и его пост. Вместе с тем, я не очень согласен с выводами Бориса, и дальше будет понятно, почему.
1. КАК УВИДЕТЬ ЭПИДЕМИЮ, ЕСЛИ ЕЁ СТАРАТЕЛЬНО ПРЯЧУТ
Я уже писал в прошлом посте, что в отсутствие адекватной официальной статистики остаётся искать косвенные сигналы и признаки. Я вижу несколько сильных и достоверных сигналов. Во-первых — госпитализации и заполнение коек (об этом я подробно писал в прошлый раз). Во-вторых — тренды поисковых систем: что ищут люди. И третье — обсуждения в соцсетях. Сегодня о поиске.
Почему это важный сигнал? Люди ищут то, что интересует и беспокоит. И Яндекс, и Гугл отдают статистику вплоть до конкретных поисковых запросов — так, можно выяснить, что именно в конкретный месяц или неделю искали люди из конкретного города или региона. В маркетинге на динамику запросов в поиске чаще всего смотрят, когда нужно оценить сезонность (например, с какого месяца начинают искать кондиционеры?). Но история поиска — отличный инструмент для поиска отклонений.
Например, так можно увидеть, что в городе N в среднем было 700 поисков в неделю по запросу «кт легких», а в какой-то момент их стало 10 000, а через несколько недель — и вовсе 21 000. Обычно это говорит либо о медийном интересе, либо о реальном тренде. С медийным интересом просто: например, в марте в России резко вырастают типично «коронавирусные» запросы, и я связываю это именно с медийным шумом (который, как будет видно дальше, сильнее влияет на одни запросы, и совсем не отражает на других). С реальным трендом тоже понятно: люди ищут то, что их волнует. И если, например, «не чувствую запахи» до этого искало 130 человек в неделю, а стало искать 2000, и это не разовый пик, характерный для медийных запросов, — это сигнал. Я такие сигналы искал.
К слову, город N из этих примеров — реален. Это Петербург. И эти цифры также реальны. Вы сами можете проверить: кт легких, не чувствую запахи. И такой рост на порядок и больше — это не что-то экстраординарное.
Дальше — техническая информация о подходе: какую статистику и откуда я вытаскивал, и почему отобрал именно такие запросы. Со второй части даю наблюдения и выводы по разным регионам, если описание методики неинтересно — можно сразу переходить туда.
Здесь и далее я вытаскиваю цифры из Вордстата — это инструмент Яндекса, который даёт цифры по показам конкретных поисковых запросов — и их общую долю в поиске. На Гугл мы тоже посмотрим, но Яндекс важнее: во-первых, его доля в поиске по России выше (59,5% против 38,5%), во-вторых — он даёт детальную и внятную статистику по поискам. Гугл показывает только относительную популярность запроса.
Для Яндекса я собрал пул из 126 запросов, которые прямо или косвенно связываю с ковидом (на деле в моём списке 152 запроса, а проанализировал более 200, но от части сознательно отказался как от менее релевантных или слишком общих для ковида).
Полный список запросов + исходные данные из Яндекса и Гугла — в этой таблице. Забирайте, изучайте, смотрите те регионы, которые интересны вам.
Сразу дисклеймер: я не берусь утверждать, что этот метод будет работать для всех регионов. Делать выводы только на том основании, что в регионе N пару запросов выросло от 100 показов до 300, неправильно. Более того: я убеждён, что нельзя судить о ситуации в регионе ТОЛЬКО на основании поисковых запросов, важно сверять с реальностью и искать другие сигналы (о них уже писал). И я не могу утверждать, что этот метод однозначно достоверен; насколько этому стоит верить — судить вам, я только привожу свои наблюдения.
Есть набор запросов, которые одинаково растут на пике эпидемии во всех регионах (прежде всего — это связанные с пропажей обоняния, кт, специфичной пневмонией и рядом лекарств). А есть запросы, которые растут только в части регионов — все они специфичны, но, видимо, отражают местные особенности протекания эпидемии и лечения ковида.
Запросы я объединил в 5 крупных групп.
- Группа 1. Симптомы. Примеры: +не чувствую вкус, пропало обоняние, держится температура, температура 37 и пр. Всего 23 запроса.
- Группа 2. Диагностика. Примеры: тест на коронавирус, вызвать врача, кт легких, томография, поликлиника телефон, пульсоксиметр и пр. 19 запросов.
- Группа 3. Лечение. Примеры: азитромицин, арбидол, клексан, гриппферон, гидроксихлорохин, детримакс, противовирусный препарат и пр. 66 запросов, из них большинство — это конкретные лекарства, которые назначаются при ковиде.
- Группа 4. Пневмония. Примеры: пневмония, матовое стекло, поражение легких. 7 запросов.
- Группа 5. Госпитализация. Примеры: вызвать скорую, [набережные] челны больница, инфекционка, больница телефон, не кладут в больницу и пр. 11 запросов.
Не все запросы напрямую связаны с ковидом. Например, «вызвать врача» или «минздрав горячая линия» не специфичны именно для коронавируса. Но все эти запросы могут быть специфичны для эпидемии и резкого роста нагрузки на здравоохранение.
Почему набор именно такой?
Во-первых, важно было отсечь поиски любопытствующих. Поэтому в моей подборке нет ни одного запроса вида «коронавирус симптомы», «признаки пневмонии», и прочая.
Во-вторых, было важно отсечь паникующих ипохондриков (я сам такой) — поэтому здесь нет и эмоциональных и субъективных запросов вроде «я умираю», «тяжесть в груди» и пр. Я старался отбирать запросы максимально объективные — и, вместе с тем, наиболее практичные. Запросы, которые станут искать люди и их близкие, уже заболев, куда более показательны.
В-третьих, именно эта группировка отражает естественное течение болезни: появляется симптоматика → идёшь к врачу и проходишь обследования → лечишься → при плохом раскладе развивается пневмония → при совсем плохом — скорая и госпитализация.
Так, в группу «симптомы» я взял наиболее специфичные именно для ковида: потеря обоняния и вкусов, температура, кашель. Ряд второстепенных тоже («першит в горле», «боли в спине» и пр.) — среди них тоже есть рекордный рост (не везде и не для всех регионов), но, как будет видно, сильнее всего выросли именно специфические ковидные симптомы.
«Диагностика» отражает как начало болезни (с запросами по врачам и клиникам), так и её развитие — когда люди начинают активно искать, где сделать КТ, закупаются пульсоксиметрами, изучают, что такое сатурация и каким должен быть уровень кислорода в крови. Побочный эффект эпидемии — рост информированности.
«Лечение» — это, по большей части, запросы по конкретным лекарствам, которые люди начинают скупать при ОРВИ сами, либо которые им назначают в поликлиниках (даже не называя это ковидом) и в больницах. Больничные назначения ещё более показательны. Все запросы с лечением объединил в 9 групп, о них отдельно дальше.
В «пневмонию» входит пару общих запросов вроде «пневмонии», но самое интересное здесь — это специфичные для вирусных пневмоний. Так, «матовое стекло» и «поражение легких» — прямые цитаты из заключений КТ, которые выдавали на руки в больницах. И такое простые любопытствующие искать не станут, это более узкие поиски — то, что человек или его близкие будут искать с бумажкой на руках.
Группа «госпитализация» — запросы в основном про скорую и больницы.
Теперь к конкретике.
2. НАБЕРЕЖНЫЕ ЧЕЛНЫ, ТАТАРСТАН: НАЧАЛО ЭПИДЕМИИ СРАЗУ ПОСЛЕ «ВЫХОДА НА ПЛАТО»?
Набережные Челны. Второй после Казани город республики. Полумиллионник с крупными производствами. Город камазов. Собственно, КамАЗ практически не останавливали: завод не работал только во время первой путинской «недели». Это город, где без конца «наблюдается стабилизация ситуации»: в начале мая в Татарстане «стабилизировался прирост», в конце мая ситуация продолжила стабилизироваться, да так продолжает стабилизироваться до сих пор: в начале июля в Челнах наблюдали «стабилизацию ситуации», и спустя две недели ситуация по-прежнему стабилизируется.
А ещё это город, где в конце июня лишился общественной должности Галимзян Зарипов — бывший главврач СПИД-центра, который заявил об «опасной ситуации» в городе и объявил, что официальная статистика по коронавирусным госпитализациям занижена в 20 раз, и назвал это преступлением.
А ещё это город, где тяжело переболели мои близкие — поэтому многое я знаю из первых рук.
Посмотрим, как именно стабилизировалась ситуация в Челнах последние 2 месяца.
→ Что имеем? Общая картина по запросам
Это — сводная картина по всем специфичным ковидным запросам, и один этот график очень показателен. Последний год запросы идут ровненько, есть только локальные пики в эпидсезон (первый в декабре, второй — в конце января). До середины марта число показов практически ни разу не превышает 12 тысяч, среднее за этот период — 9 тысяч в неделю. Среднее за эпидсезон в январе-феврале — 11,4 тысячи. В марте происходит естественный всплеск: во-первых, арбидол даёт сразу +1−1,5 тысячи запросов (помните новости об арбидоле как панацее?), во-вторых — чаще начинают искать «пневмонию», «температуру и кашель», «температуру 37». Это ожидаемо: всё это всплеск медийного интереса. Кроме того, в середине марта, похоже, в Челнах идёт сезонный всплеск гриппа и ОРВИ: сильно растут запросы по ним (грипп, орви), отсюда — температура.
Куда интересней то, что происходит в конце мая.
- С 18.05, когда в Татарстане объявили «плато», показы начинают экспоненциально расти и прибавляют по 15−40% в неделю. Рост такой, что к середине июня Вордстат фиксирует 44 тысячи «коронавирусных» запросов, что в 7 раз превышает их ожидаемое число (если делать поправку на сезонность). Если сравнивать с эпидсезоном в январе-марте, превышение — в 4 раза. В пиковую неделю каждый 177-й показ в поиске Яндекса — коронавирусный (0,7% относительных на пике, в норме должно быть ~0,12%); для сравнения, в марте, ещё до начала эпидемии и во время медийной шумихи, их доля не превышала 0,21%. Напомню: официальная статистика за ту же неделю — 56 новых случаев по Челнам. Вместе с тем, делать выводы о каком-то реальном количестве заболевших на основании показов по поисковым запросам нельзя — метод для этого не подходит.
- Всего за 4 недели июня, с 1 по 28 число, было 153,5 тысячи запросов, в среднем за неделю — 38,4 тысячи. В норме, если оценивать тренды прошлого года, должно было быть всего 25 тысяч запросов за все 4 недели. За предшествующие 4 недели мая запросов было в 2+ раза меньше — 71,5 тысячи, среднее — 17,8. При этом на начало мая приходилось всего 12−16 тысяч запросов, основной рост происходит с середины месяца. За 4 недели апреля — 58 тысяч, за 4 недели марта — 61 тысяча. Превышение по показам — от 100 до 127 тысяч.
- Есть несколько узких, специфически пневмонийных запросов: «дву/двухсторонняя пневмония», «кт легких», «вирусная пневмония». Выше я их не учитываю, потому что они входят в запросы более общие (кт, пневмония). Эти запросы оказались минимально подвержены медийному шуму (кроме «вирусной пневмонии» с лёгким всплеском в марте), и потому показательны. С конца апреля эти запросы начинают понемногу расти, а с конца мая демонстрируют резкий экспоненциальный рост с пиком 15 июня:
В норме следовало бы ожидать ~300 запросов в неделю, если делать поправку на медийный шум — то до 500 показов. На деле их оказывается больше почти на порядок: 4,1 тысяча на пике, по 3,2−3,7 тысяч в соседние недели.
Это не простой всплеск медийного интереса. Это похоже на большую эпидемию.
По Яндексу её масштаб не оценить, потому что он даёт цифры только за последние полтора−два года. Но по трендам Гугла видно, что это — самое серьёзное, с чем мы сталкивались как минимум с 2004 года; более ранней статистики у нас нет. О Гугле отдельно ниже.
→ Что показывают запросы по группам?
Помните пять тематических групп, в которые я объединил полсотни запросов? Вот график, где видно, как растёт каждая группа:
По каким-то показов сильно меньше, но все до единой группы резко отражают общую картину: локальный пик в марте — и скачок до небес с середины мая и до конца июня.
Рост абсолютных значений вы видите сами. Интересно, как именно вырастают запросы по отношению к самим себе. В норме стоило бы сравнивать нынешние показатели с прошлым годом; однако есть коэффициент медийного интереса, и на него важно делать поправку. Несмотря на декларированную победу над эпидемией, коронавирус всё это время оставался одной из первых тем. Поэтому возьмём за новую норму апрель.
Начало мая идёт на уровне (и даже ниже) апреля. Начиная с середины месяца, начинается рост: быстрее всего растут группы «диагностика» (+40% к среднему) и «симптомы» (+17% к среднему за апрель, +33% к прошлой неделе).
С конца мая начинается резкий прирост запросов по «пневмонии» (+30% к среднеапрельскому, +73% к началу мая) и «лечению» (+64%).
В июне продолжается бурный рост всех групп — в среднем, от 2 до 4 раз; исключение — только «госпитализация», здесь рост в пределах 33−80% к среднему в апреле. И это, наверное, хорошая новость. Но и запросы здесь наименее специфичные — кроме того, когда доходит до госпитализации, ты меньше всего будешь идти в Яндекс.
→ Что с отдельными запросами?
- Группа «симптомов»
Вот так она выглядит (с тем самым всплеском по «температуре 37» в марте, о котором я уже писал):
Рекордный рост запросов, связанных с потерей обоняния: местами — рост почти на два порядка:
Если в прошлые июль−август в неделю приходилось по 20−25 таких запросов, то с середины мая их число начинает резко расти, и уже в середине июня таких запросов — 1,4 тысячи. В неделю.
2. Группа «диагностических» запросов
В топе — КТ, «поликлиника телефон», анализ на коронавирус, томография. Но вообще рост происходит среди всех запросов. Растут все, но самое серьёзное превышение — у запроса «кт»: на него приходится по 2,3−3,8 тысяч показов в неделю в июне при норме в 400−500.
3. Группа «лечение»
Это — самые практичные запросы, и с ними интересно. Сначала — общая картина:
Запросы разные по типу, и их лучше смотреть тоже в разных группах. Так, если арбидол прописывает первичное звено — терапевт в поликлинике, то цефтриаксон, гепарин или гидроксихлорохин назначают чаще уже в больнице. Это же предписывают и рекомендации Минздрава. Есть и третья группа: препараты, которые назначают при выписке.
Что видно при сравнении групп?
Резкий всплеск арбидола в марте, а с середины мая — бурный рост арбидола же, азитромицина и преднизолона, которые поголовно стали прописывать в челнинских поликлиниках. Тогда же происходит 3−3,5-кратный рост запросов «как лечить коронавирус» и «противовирусный препарат».
С конца мая начинает резко расти цефтриаксон — антибиотик, который применяют в местных больницах (наряду с азитромицином). К концу первой недели июня начинается резкий рост антикоагулянтов клексана и гепарина, иммунодепрессанта дексаметазона, антибиотика цефтриаксона и противомалярийного гидроксихлорохина. Это препараты из рекомендаций Минздрава, и, по моему частному опыту, их дают уже госпитализированным — в поликлиниках эти препараты не назначали. Эти препараты есть в выписке моих близких (кроме гепарина, который кололи, но в выписку вписали не его, а клексан). Сюда же — и кислородная подушка в качестве оксигенотерапии.
Ещё несколько препаратов рекомендованы после выписки: это детримакс, тромбо АСС, АЦЦ, магне B6, вобэнзим. Рост по всем, наименьший — по магнию и вобэнзиму. Сюда же относится и дыхательная гимнастика, которая пробила пик в марте на волне медийного интереса, затем резко упала в апреле, а к середине июня снова начала резко расти.
Другая группировка — по типу лечения / препаратов:
Здесь я выделил 9 групп, и в каждой исторический максимум приходится на период с 8 по 29 июня (у разных групп пик отличается). Самые характерные группы — антибиотики (рост в 7+ раз к апрелю, и в 10+ к аналогичному сезону прошлого года), фуфломицины — всевозможные кагоцелы, арбидолы, -фероны и прочие препараты без доказанной эффективности (x4,5 к апрелю, x10 к прошлому году), антикоагулянты и гормоны (аналогично).
Относительные цифры ещё наглядней. Я нормализовал основные группы по их собственным максимумам, где 100% — исторический пик конкретной группы запросов:
Видно, что все до единой группы показывают 100% 15−28 июня. Другой пик — в среднем, на 60−75% от июньского максимума — приходится на март (но здесь растут только общие запросы, противоинфекционные вроде гидроксилорохина или калетры, и фуфломицины — привет, арбидол).
4. Запросы в группе «пневмония»
Их немного, и основной рост даёт «пневмония» и её производные (если смотреть по отдельности, колоссальный рост везде среди специфичных запросов вроде «двусторонней пневмонии», «вирусной пневмонии» и пр.). На общем фоне незаметно, но колоссально — в разы и на порядки — растут и специфичные «матовое стекло», «поражение лёгких», «воспаление легких». Вот здесь наглядней: пневмония по левой оси, остальное — по правой:
5. Группа «госпитализация»
Как я писал выше, таких запросов немного, и показов по ним — тоже немного. Но и здесь значительный рост по каждому запросу. В топе — «челны больница», «инфекционная больница» и «вызвать скорую».
→ Как это соотносится с личным опытом?
Здесь много запросов, которые отражают то, что происходило с нашими близкими.
Первые симптомы у них появились 2 и 5 июня (а через несколько дней мы узнали ещё о нескольких больных среди родственников и друзей в первом кругу, хотя давно живём в Москве и в Челнах мало с кем общаемся). Начиналось всё стандартно: со слабости, температуры под 38 и надсадного сухого кашля.
Врачи в поликлинике тестов не делали, ставили диагноз «ОРЗ» и прописывали арбидол и азитромицин; через несколько дней, на повторном приёме, добавили преднизолон, флемоксиклав и аспирин.
В середине первой недели болезни пропало обоняние. Тогда же, после ухудшения и вызова скорой, удалось сделать КТ, показавшее «поражение легких» до 25% и «симптом матового стекла». После подтверждения пневмонии взяли тест.
Во вторую неделю произошло резкое ухудшение, падение сатурации до 88% и сильное повышение температуры, а КТ показывало уже 60% поражения — и мы срочно решали вопрос с госпитализацией. Гепарин, дексаметазон, цефтриаксон, гидроксихлорохин давали уже в больнице. Клексан колоть стали ещё дома — по рекомендации нашего московского врача, который наблюдал близких всю болезнь.
→ 92% ковидных запросов
По Челнам из 84 специфичных запросов у 77 (92%) пик показов приходится на июнь, ещё у 3 — на последние две недели мая, и ещё у 4 — на другие месяцы, в основном март (тамифлю, температура 37, дыхательная гимнастика, вобэнзим). По 47 запросам (56%) пик приходится на середину июня — с 8 по 22. Ещё у 23 (27%) — на последнюю неделю июня. Из совсем узких, специфических именно для ковида, пик в июне у 100%.
Но это один отдельно взятый город, и один набор запросов. Подкрепить мне это почти нечем, кроме своего — весьма ограниченного — опыта. Официальные же цифры по Татарстану и по Челнам за тот же период говорят об обратном. Почти — потому что есть есть ещё один способ перепроверки: по социальным сетям; но об этом, если будет время, расскажу в следующий раз — и покажу, как эпидемия отражается на местных пабликах и как меняются настроения по мере развития эпидпроцесса.
→ Два апдейта: есть новые данные
1. Челнинский ЗАГС опубликовал данные по смертности за первое полугодие. В мае прирост смертности +21% к прошлому году (+81 смерть), в июне прирост смертности +68% к прошлому году (+237 человек). Детальную разбивку см. на сайте загса. Избыточная смертность — самая честная и достоверная оценка. В апреле значимого прироста смертности не происходит. Это подтверждает предположение, что эпидемия здесь начинается в мае и достигает пика в июне.
2. Ещё один способ перепроверки — оценка того, как растёт доля людей с антителами. О методе подробно расписал здесь. В двух словах: по этой методике можно сделать те же выводы. Когда «Инвитро» запускает тестирование на антитела 18 мая, в Набережных Челнах доля IgG-положительных — на уровне погрешности (до 2%). С каждой неделей доля положительных тестов непрерывно растёт и достигает 47% к началу июля.
Чтобы перепроверить подход и понять, насколько можно доверять Вордстату, я пошёл изучать Москву. И Дагестан.
3. ЧЕСТНЫЙ СПАД В МОСКВЕ
Москва — регион, в достоверности статистики которого не приходится сомневаться (NB: я не о последних неделях). Про Москву хорошо известно, как именно здесь протекала эпидемия: когда начался рост, как увеличивались госпитализации, когда произошёл пик — и дальнейший спад. Это известно не только по официальной статистике, но и по статистике госпитализаций — общей и отдельных ковид-госпиталей, и по динамике выявленных пневмоний в КТ-центрах. Поэтому Москва — идеальный кандидат для проверки.
Москва показывает два пика: первый в марте, второй — на рубеже апреля-мая.
Мартовский пик — в большей мере медийный: тогда Италию захлестнула эпидемия, Европа закрылась, а коронавирус надолго стал темой №1. Не будь этого медийного всплеска — мы видели бы гладкий, плавный рост запросов.
Мартовскому пику мы обязаны нескольким основным запросам. Это «тест на коронавирус», «анализ на коронавирус», «как лечить коронавирус» и мелькавшие в СМИ калетра, гидроксихлорохин. Ещё пульсоксиметр, о котором все внезапно узнали (спасибо медиа), и «вызвать врача» (вероятно, этот пик вызван ростом всеобщей тревожности).
Например, так выглядит динамика только по этим запросам:
А вот с детализацией до конкретных запросов:
А вот так — по всем остальным запросам, обратите внимание на сильно сглаженный график. Локальный пик есть, но куда менее выраженный:
И отдельно — детальная картинка:
Здесь тоже видны локальные пики. Во-первых, азитромицин резко растёт после 16 марта — именно тогда связку «азитромицин + гидроксихлорохин» объявили проверенным лекарством от ковида. Есть (увы, на этом графике плохо различимая) голубенькая ёлочка в начале апреля — это запрос «матовое стекло». Совпадает с публикацией японского исследования пассажиров Diamond Princess: почти у половины заразившихся выявили симптом «матового стекла» в лёгких. Конечно, это стало одной из главных тем в СМИ.
Эти пики нам ещё пригодятся: по ним хорошо видно, как выглядит всплеск медийного интереса. Это резкий разовый скачок, продолжительностью в 1−2 недели, с явным внешним стимулом (и стимул здесь — материалы в медиа).
Органический рост запросов выглядит иначе: подъём происходит не за одну неделю, за подъёмом следует стабилизация — равномерная волна интереса, затем начинается спуск — как правило, более пологий, чем рост.
Словом, показы отражают и динамику самой эпидемии. То же самое показывают и челнинские графики.
Что видно по Москве?
По Москве я вытащил 50 запросов. По 40 из них (80%) пик приходится на три недели: с 20 апреля по 10 мая. Самая сложная — неделя с 27 апреля по 4 мая: здесь пик 22 запросов (44%), на следующей неделе пиковых уже вдвое меньше, дальше сходят на нет. Ещё у 5 (10%) пик в марте, далее — повторный — в июне.
На московском плато — с 20 апреля по 18 мая — в Яндексе приходится более миллиона типичных ковидных запросов еженедельно.
В пиковую неделю — 1,2 млн, превышение — почти на порядок по сравнению с ожидаемым в мирное, не-ковидное время. На все «избыточные» показы (которых в норме быть не должно) приходится 0,2−0,25% от всех показов в поиске Яндекса; каждый показ из 400−500 — коронавирусный.
Резко растут все группы. После отскока в конце марта начинают одновременно расти «Диагностика» и «Лечение», с лагом в неделю отстают запросы «госпитализации». С «симптомами» и «пневмонией» история отдельная: они начали расти ещё в конце февраля-начале марта, и первичный рост я связываю не с эпидемией, а с медийным шумом. В пользу этого говорит перелом в середине марта и там, и там — и последующее возобновление резкого роста уже в начале апреля:
Специфически пневмонийные запросы вроде «кт легких» и «вирусной пневмонии»
С середины марта они начинают понемногу прибавлять, а с начала апреля демонстрируют резкий экспоненциальный рост с пиком 27 апреля и дальнейшим медленным спадом:
На пик эта группа забралась всего за 4 недели, а падает уже 9 — и до сих пор не вернулась до уровня начала апреля.
И всё это соответствует реальной динамике эпидемии в Москве. Экспоненциальный рост новых случаев, начавшийся с марта. Уже к середине апреля происходит вал госпитализаций (тогда же появляются опасения, что Москва может не справиться), пик в начале мая, замедление, спад.
Вот так соотносятся новые случаи с поисковыми запросами. NB: здесь число запросов и случаев за неделю (а не за день):
→ Как соотносятся динамика запросов и официальная статистика?
Тут интересно:
Здесь не абсолютные числа, а относительные: за 1 я взял точку максимума каждого из графиков, остальные точки считаются от 1. Например, если на пике была 41 тысяча новых случаев за неделю, то в неделю, когда было 4 тысячи случаев, будет точка 10%. Что здесь видно?
Во-первых, рост в Москве начинается уже с начала марта (и это только узкие запросы, которые, напомню, относятся к кт лёгких и заключениям с пневмониями, т.е. это уже минимум 1−2 недели с начала болезни).
Во-вторых, официальная статистика отстаёт от поисковых запросов в среднем на 1−2 недели (именно её динамика, а не конкретные значения). Поэтому пик запросов пришёлся на конец апреля-начало мая, а пик официальных случаев — на последнюю неделю майских.
И в-третьих, с завершением «нерабочей недели» динамика по новым случаям начинает падать быстрей, чем по поисковым запросам — если до этого статистика отставала от запросов, то, начиная с 11 мая, резко их опережает. Может ли это быть свидетельством подкручивания статистики — я не знаю и предполагать не буду; вероятно, здесь есть более простые объяснения. Так или иначе, сейчас официальная статистика держится на уровне 12% от своего еженедельного максимума, тогда как узкие запросы — на уровне 19% от максимума, а широкие — на уровне 30% (но они более подвержены медийным колебаниям).
Наконец, здесь видно, что, даже если статистика и подкручивается, она по-прежнему отражает действительность. И в Москве никакого всплеска так и не произошло за месяц с момента снятия ограничений. Целевых запросов становится меньше. Эпидемия затухает.
А теперь — Дагестан.
4. ДАГЕСТАН: АПОКАЛИПСИС ИЗ СТОЛИЦЫ
В отличие от Москвы, по Дагестану точные тайминги восстановить не удастся: нет достоверной статистики. Но мы хорошо знаем, что здесь происходило: в конце апреля появляются тревожные сигналы, а уже в начале мая прорывает плотину, становится ясно, что в Дагестане катастрофа, он попадает в фокус СМИ и выходит на федеральный уровень. Напомню основные сигналы и тайминги:
• 29 апреля — видеообращение премьера МВД.
• 30 апреля — письмо анестизиолога-реаниматолога из города Дагестанские Огни о тяжёлой ситуации.
• 1 мая — обращение к руководству республики главы селения Тебекмахи с жалобами на резкий рост смертности и заболеваемости и на отсутствие лекарств и медпомощи.
• 5 мая — статья в газете «Молодёжь Дагестана» с расследованием по разным регионам и больницам с попыткой восстановить реальную заболеваемость в регионе..
• 9 мая — материал в «Медузе»: «Это просто война». Большая обзорная статья о тяжёлой ситуации в Дагестане.
• 16 мая — публичное признание катастрофы, интервью министра здравоохранения республики, где он озвучивает, что заболело 13,7 тысяч человек (тогда как официально — 3,3 тысячи), а умерло — почти 700 человек (официально — 27).
После этого о Дагестане начинают говорить все. Путин проводит совещание по Дагестану, МЧС направляет технику и специалистов, Минобороны — мобильные госпитали, в республику направляют московских врачей.
Но было уже поздно. Если смотреть на запросы, то видно, что пик в Дагестане совпал с московским. Дагестан вышел на федеральный уровень слишком поздно: к тому моменту, когда признали катастрофу, он уже прошёл свой пик и уже 2+ недели шёл на спад.
→ Что имеем в Дагестане
Если Москва начинает реально расти уже в марте, то в Дагестане это происходит в апреле. Начиная с 6 апреля, идёт катастрофический рост; за какие-то 3 недели Дагестан добирается до пика и держится там 2 недели; затем, после окончания майских, идёт на спад. Так выглядит график по запросам в Дагестане: 200+ тысяч в неделю:
Превышение 14-кратное, если сравнивать с прошлым межсезоньем, и почти 7-кратное, если сравнивать с мартом.
Узкие запросы ещё более показательны. На пике — 7+ тысяч показов в неделю; в не-ковидное время их должно быть 30−40 — разница в 200 (!) раз. И ковид-истерия здесь ни при чём: в марте, когда ковид был федеральной темой №1, узких запросов было в 46 раз меньше — по 150−160 в неделю:
Одинаково вырастают все группы заросов. Пик по всем пяти группам приходится на две недели: с 27 апреля по 11 мая. У «симптомов» пик занимает обе недели, у «лечения» и «пневмонии» — конец апреля, у «диагностики» и «госпитализации» — начало мая:
Из 99 запросов, которые я вытащил для Дагестана, в эти две недели пиковыми оказывается 78. Ещё 10 — в неделю с 11 по 18 мая. После 18 мая пик приходится только на 4 запроса: это «дагестан больница», «тромбо асс», «аспирин» и — неожиданно — «анализ на коронавирус» (выросла информированность после медийной шумихи?).
Ещё показательный момент: 57% всех запросов в Дагестане с пиками в апреле-мае — это группа «Лечение» (в Москве их доля 35%, в Челнах — 41%). Я не знаю, чем объяснить, но в Дагестане в эти недели ищут, кажется, вообще все возможные лекарства — бьют рекорды фуфломицины, антибиотики, антикоагулянты — всё. Это отчаяние?
→ Почему рванул Дагестан? Немного инсайтов
Поисковые запросы отражают общую динамику эпидемии. Но они не объясняют главного: почему в апреле рванул именно Дагестан — и как так вышло, что пик совпал с московским, а Дагестан рос стремительней, чем Москва.
На это у меня есть статистика по поискам и бронированиям Aviasales, где я работаю. Объяснение простое:
C началом «нерабочих дней» дагестанцы начинают стремительно улетать из Москвы домой.
- В этот период вдвое (!) вырастает доля поисков и бронирований из Москвы в Дагестан среди всех бронирований. Это не локальный всплеск: они обычно дают +15−20% к среднему, здесь же рост +100%. И в апреле именно Москва — Махачкала становится самым популярным направлением у Aviasales. В другие города и регионы летели значительно меньше.
- Этот тренд начался ровно тогда, когда объявили «режим нерабочих дней»: 30 марта. Тогда же резко падает глубина бронирования: люди бронируют билеты с максимально скорым вылетом. Понятное дело, что это удаётся не всем — рейсов ограниченное количество. Поэтому улетают весь апрель, особенно активно — в первые недели. К слову, объявление «нерабочего месяца» приводит к очередному всплеску бронирований. В топе — вновь Москва — Махачкала.
- Улетают семьями: в этот период растёт доля билетов с детьми. В обычные месяцы билетов с детьми — 7−9%. Начиная с конца марта, их доля резко растёт, и к апрелю достигает 13%. Это обычные цифры для июля — сезонного пика — но не для середины весны.
Если учесть, что к тому моменту Москва уже активно растёт, это объясняет и дагестанский пик в конце апреля. Десятки тысяч местных возвращаются домой. Среди них, очевидно, немалая доля уже инфицированных. И дальше расползание эпидемии уже не остановить.
5. ЕЩЁ ОДИН СПОСОБ ПЕРЕПРОВЕРКИ: ГУГЛ ТРЕНДЫ
Смысл Гугл Трендов аналогичен Вордстату: сервис показывает популярность поисковых запросов в динамике. Важное отличие — он не даёт точного числа запросов, Тренды отражают именно динамику популярности, где 100% — пик интереса людей. Поэтому и методика здесь другая. Тут я не исследовал десятки и сотни запросов — я взял несколько наиболее характерных. Среди всего набора нашёл самый популярный (Гугл позволяет сравнивать разные запросы), и его 100% принял за единицу; все остальные запросы подстраивались под него.
Это не идеальный подход с кучей недостатков, но он позволяет сгладить неоднородность разных запросов, когда «пневмонию» ищет 20 000 человек, а «актемру» — 3 000, но оба показывают 100% в одну из недель, и непонятно, какой из запросов весомей.
→ Что тут видно?
Сначала Москва. Вот динамика 10 запросов за последние 5 лет:
Почти у всех пик — всё в те же недели: с конца апреля по середину мая. Исключение — «пневмония»: здесь пик в середине марта.
К слову, виден ещё один резкий всплеск «пневмонии» в конце января — ровно тогда, когда по Москве гулял другой вирус, тот самый, который многие переболевшие приняли за ковид («да я им переболел ещё в декабре/январе!»). К слову, я тоже подцепил тот вирус, и это произошло в конце января, и закончилось вирусной пневмонией (и болезнью всей семьи). Но это не был — да и не мог быть — коронавирус.
Для наглядности — наложил на гугловые тренды запросы Яндекса, и там, и там взял сводные данные, нормализованные по шкале 0−100%, где 100% — пик популярности группы запросов. Пики и падение идеально сходятся, отдельные тренды тоже; отличается только восхождение на пик:
Далее Дагестан. Резкий пик — с 27 апреля по 11 мая:
В зависимости от запроса, превышение здесь — от 4 до 10 раз. Тренды в Яндексе и Гугле совпадают идеально:
Совпадает и их динамика и отдельные переломы:
И, наконец, Татарстан (отдельно Челнов нет). Здесь более чем наглядно: по всем запросам — пик к середине июня, а где-то и в конце июня продолжается рост:
6. В ТАТАРСТАНЕ НИЧЕГО НЕ ЗАКОНЧИЛОСЬ
Теперь выкинем из статистики Вордстата Челны. Вот так выглядит остальной Татарстан за вычетом Челнов:
Здесь видно, что остальная республика начала расти в середине мая: в среднем в неделю прибавлялось по 1000 целевых показов (тогда как норма, если брать апрель — 5,5−6 тысяч). С начала июня всё ускоряется, и теперь идёт рост +4000 показов в неделю — и это продолжается уже месяц.
В первую неделю июля приходится уже 23 тысячи тематических показов — уже 4-кратное превышение к апрельской норме.
NB: здесь я взял не всю группу запросов, а 15 основных. Главный вклад дают азитромицин, арбидол и кт лёгких:
В Челнах идёт спад показов— но не в других городах и районах. И Вордстат даёт возможность посмотреть с детализацией ещё несколько городов.
Что видно по другим татарским городам?
- С начала июня по показам стала расти Казань, особенно активно в середины месяца. Пиковые значения по Казани прямо сейчас — последние 2 недели. Есть надежда, что Казань уже вышла на плато и дальше не будет расти — как мы видели по Челнам, Москве и Дагестану, пик запросов длится обычно две−три недели, затем начинается постепенный спад.
- В начале июня начинается медленный рост в Нижнекамске по отдельным запросам. С 22 июня рост ускоряется, и последние две недели — рекордные, особенно по узким запросам вроде «пропало обоняние», «кт легких», «вирусная пневмония» и пр. Что интересно, Нижнекамск и Челны входят в одну агломерацию, между городами — 50 км, однако Челны опережают соседа минимум на 2−3 недели.
- Альметьевск — небольшой город к югу — начал отрастать с 22 июня и, судя по запросам, здесь ещё далековато до пика: пока только стремительный рост, а пик запросов я ожидаю к двадцатым числам июля. Растёт большинство специфичных запросов.
- Остальной Татарстан также растёт. Последние две недели по республике — пиковые сразу по ряду запросов. Возможно, это промежуточный пик — «кт легких» и «вирусная пневмония» продолжают расти; а возможно, это выход на плато. То самое, которое в регионе объявили два месяца назад — 18 мая.
→ О чём это говорит?
Если предположить, что поисковые запросы отражают реальную динамику эпидемии, то можно восстановить, как она протекает в Татарстане.
По-видимому, сначала вспышка произошла в Челнах. Рост пошёл с середины мая. К концу месяца это превратилось в большую и серьёзную вспышку с валом поисковых запросов и — по разным свидетельствам — с резким ростом госпитализаций. Официальная статистика всё это время показывала стабильность и уверенный спад.
За Челнами начинает расти и Казань — рост медленный, с начала июня. К середине июня Казань выходит на пика и последние недели держится на подобии плато.
Нижнекамск отстаёт от Казани где-то на неделю, от Челнов — минимум на 3−4. Альметьевск идёт с лагом ещё в неделю — он по-настоящему расти начал только к концу июня, и до пика будет добираться ещё 1−2 недели.
Остальная часть республики по динамике ближе к Казани: так же начала расти с июня, так же держится несколько недель на пике (возможно, обманчивом). К сожалению, тут уже отдельных районов не вычленить.
Эпидемия распространяется неоднородно. В то время, как один регион горит, в соседнем всё может быть относительно спокойно. В апреле Россия закрылась на карантин — но реально эпидемия начиналась только в Москве. В мае карантин сняли — но только тогда эпидемия пришла в регионы.
Однако неоднородно всё развивается и внутри региона. Город может болеть — а в соседнем тем временем всё будет спокойно. Похожие примеры были и в других регионах — например, вспышки в Северодвинске и в Великих Луках. К слову, и там, и там полыхнули именно предприятия; напомню, что Челны — моногород, и главное предприятие здесь — это КАМАЗ. Этот завод — и есть Челны.
В чём причина такого неравномерного распространения вируса — я не знаю; предположу, что дело в низкой транспортной связанности населённых пунктов и в немобильном населении.
С Татарстаном пока всё. Напоследок — ещё про два региона. Оба интересны и показательны. Это Алтайский край и Петербург.
7. АЛТАЙСКИЙ КРАЙ: УВИДЕТЬ НАЧАЛО ЭПИДЕМИИ
За Алтайским краем я эпизодически слежу с мая. До июня в регионе всё было ровно. А в середине месяца начали расти специфические запросы «пропало обоняние/запахи/вкусы» и пр., и расти быстро. Написал об этом своей хорошей знакомой, у которой на Алтае родные; запросы, связанные с пневмониями, на тот момент не росли — и я предположил, что для них может быть ещё рано. Так и вышло. После 15 июня — понеслось: начала расти «двухсторонняя пневмония» и ушло в резкий рост «кт легких». Сегодня рост продолжается, и он стремителен:
Превышение майской нормы уже втрое, обычного июля — в 17 раз, и это только по 6 основным запросам:
На удивление, официальная статистика этот рост отражает. До 3 июля здесь была слишком ровная и фальшивая линеечка в 73−78 новых случаев, с 4 июля регион начал резко расти — и к 10 июля вышел на новое ровное «плато» в 228−240 случаев. Но более показательны здесь не официальные кейсы, а госпитализации и доля симптомных больных.
Сначала про госпитализации. Как я писал в прошлом посте, это — один из самых достоверных сигналов: перегруженность больниц скрыть не удастся.
Изначально в крае планировали развернуть 1159 коек, к концу мая подготовили 1736, на начало июля коек было уже 1939. За последнюю неделю срочно развернули ещё 200. Сегодня коек 2170, и они заполнены на 77%.
Можно попробовать восстановить цифры по статистике местного Минздрава — достаточно подробной, — и заявлениям чиновников.
8 июля министр здравоохранения региона на пресс-конференции заявил про 70% свободных коек «для ковидных пациентов», но оговорился, что эти койки занимают пациенты с вирусными пневмониями без подтверждённого вируса. С их учётом свободных коек «чуть более 30%». Так, на 8 июля в крае было занято ~1300 коек (67%), из них с подтверждённым коронавирусом было всего около 580 пациентов, т.е. доля положительных результатов ~44%. Если предположить, что то же соотношение подтверждённого и неподтверждённого ковида сохраняется, то нынешние 230−240 случаев в день дают реальных 410−440 случаев.
Вместе с тем, неделю назад доля бессимптомников среди выявленных составляла всего 30−40% (при реальной доле бессимптомных в ±80%, такие цифры были и в Алтайском крае до нынешнего роста). Эта тенденция сохраняется до сих пор. Я собрал цифры с 30 июня — местный Минздрав отчитывается о количестве бессимптомных и симптомных случаев ковида, симптомные делит на «орви» и «пневмонии». Пропущены 4 и 5 июля — Минздрав в один из дней не отдал нужных цифр:
Бессимптомных —стабильно 30−40%, зато доля новых случаев с пневмониями — в среднем составляет 25%. Если учесть, что реально бессимптомников должно быть под 80%, это даёт серьёзный недоучёт ещё в 460−620 случаев.
С учётом неподтверждённого ковида это даёт 870−1060 предположительных новых случаев в день в Алтайском крае. В пересчёте на миллион населения выходит 370−460 кейсов. Для сравнения — столько было в Москве в её пиковые дни в начале мая.
→ Причём здесь поисковые запросы?
Начало вспышки можно предполагать уже по росту первых запросов, которые отражают наиболее специфичные симптомы. Вероятно, есть набор запросов, которые можно использовать как предикторы начала эпидемии в регионе.
Пока самый достоверный предиктор, который я обнаружил — это запросы, которые касаются потери обоняния и вкуса.
Это симптом, очень специфичный именно для ковида, при этом в не-ковидное время таких запросов немного, а колебания среди них незначительны (в отличие от, например, «пневмонии» или «температуры 37» или «температуры и кашля»). Вместе с тем, медийная шумиха не сильно влияет на популярность этих запросов.
Пока везде, где я смотрел (а помимо этих регионов я бегло отсмотрел ещё с десяток регионов), именно эти запросы начинают заметно расти с началом вспышки. Как правило, с лагом в 1−2 недели от них следуют запросы пневмонийные и больничные. От начала роста этих запросов проходит, в среднем, около 4−5 недель до выхода на пик — затем пик длится недели 2−3, после чего начинает понемногу падать. Это пока общий паттерн для всех регионов (с исключением в виде Дагестана).
И это пока исключительно гипотеза, которая требует перепроверки на большем количестве регионов. А ещё перепроверить стоит другие запросы — таких предикторов может быть десятки.
Будет интересно так же отследить и другие регионы.
8. …И УВИДЕТЬ ЕЁ КОНЕЦ: ПЕТЕРБУРГ
Совсем коротко — о Петербурге. О том, что там происходит, я подробно писал в прошлый раз. На тот момент — а это было начало июня — Петербург уверенно рос и подбирался к пределу коечных мощностей. Что было дальше?
По запросам похоже, что к началу июня в Петербурге произошёл перелом и эпидемия начала медленно спадать. Пик пришёлся на конец мая-начало июня, а уже к середине месяца шёл заметный спад, который продолжается и до сих пор:
К слову, реальной динамике это соответствует. Запросы начинают резко расти в конце апреля — похоже, именно тогда в Петербурге начинается эпидемия. Мы знаем, что именно на майские праздники начинают сильно расти госпитализации, и после майских их число только увеличивается. К концу мая-началу июня госпитализируют по 700−750 человек в день — дальше их число начинает медленно, но падать. Динамика запросов это также отражает — и тоже с лагом в 1−2 недели.
По Петербургу я вытащил статистику только для 7 наиболее специфичных запросов. Резкий перелом даёт запрос «тест на коронавирус» — если смотреть на другие, спад в Петербурге куда более пологий и гладкий:
Этот график ложится и на реальные данные.
По статистике сортировочных центров КТ, виден рост в начале мая, затем ускорение к концу майских и пик обращений в конце месяца. В начале июня обращений (как и выявленных пневмоний) становится меньше, и до конца июня идёт медленный, пологий спуск — в июле же он продолжается, и сейчас выявляют вдое меньше пневмоний, чем в июне (в среднем 60−70 против июньских 140−150 и против майских 230−280):
Как заметили в комментариях, отчасти пик конца мая обязан поломкой томографов в нескольких КТ-центрах — это произошло 21 мая, тогда же нагрузка ещё трёх небольших центров упала на МИБС. К 27 мая, когда приходится абсолютный пик обращений, руководитель сортировочного КТ-центра в Петербурге говорит о том, что в порядке эксперимента поменялась маршрутизация, и круглосуточно принимают только они ещё один центр, где аппарат в ремонте. 26 мая МИБС же заявляет, что «пока мы идем к вершине», а уже 5 июня — что это плато (другая маршрутизация, часть пациентов перестали привозить в ковид-центр и направили в другие центры, поэтому поменялась и структура, и число пневмоний). Это подтверждает, что на конец мая−начало июня в Петербурге приходится пик.
Апдейт: новые данные
Стало известно, что в мае в Петербурге число пневмоний выросло в 9,9 раз к прошлому году. Местный Комздрав прямо говорит, что причина — ковид. А ещё Комздрав заявил, что пик эпидемии в Петербурге пришёлся на конец мая−начало июиня. Ровно то, что мы видим и по поисковым запросам.
Напоследок — про койки.
К 23 июня в Петербурге было занято 87% коек (~1500), спустя неделю — 80% (2460), к 6 июля их было уже 72% (~3000), а на этой неделе свободных коек уже 52% (4752). Общее число коек под ковид уменьшается — с конца июня часть стационаров вновь начали оказывать плановую помощь.
Петербург тоже показывает честный спад. Как и Москва, Дагестан и, похоже, Челны.
Но Москва, Дагестан, Петербург, Челны — малая часть регионов. Эпидемия распространяется очень неравномерно.
Не надо обманываться. Ничего не закончилось. Эпидемия в России в разгаре.
И рассчитывать нужно только на себя.