Telegram Web Link
Меня спросили, как максимально эффективно провести время на научной стажировке. Вопрос супер интересный и значительно менее покрытый материалами, чем «как пройти на стажировку»

Сама постановка вопроса заставляет меня думать, что у человека всё будет хорошо. Некоторые сразу едут просто потусить. Никого не осуждаю, но здесь будут советы не про это

На мой взгляд, полезное в стажировках делится на две части:
🚀 Работа
🚀 Нетворкинг

С первым, как будто бы, всё ясно: берёте свои маленькие азиатские ручки и следуете моему жизненному кредо. К сожалению, на студенческом уровне эта часть во многом зависит не только от вас. Может не повезти с проектом, руководителем или оборудованием. В любом случае от вас зависит количество работы и вовлечённость. Если место выглядит перспективно – выкладывайтесь и не считайте часы. Если тема кажется скучной или непонятной, постарайтесь в неё вникнуть: не просто же так люди тратят на неё своё время, а кто-то выделяет деньги на работу. Со мной на стажировке в Сингапуре в 2019 году был парень, которого удручало копаться в оцифрованных экскрементах летучих мышей чтобы найти неизвестные вирусы. «Кому вообще это интересно?», – вопрошал он. Через год вся планета знала историю об одной летучей мыши, а каждый пятый стал экспертом в вирусологии

Даже в неудачной среде можно с пользой провести время: посмотрите онлайн курсы, порефлексируйте, что именно вам не нравится и как избежать негативного опыта дальше, ну или хоть выспитесь на будущее

Нетворкинг – далеко не менее, а порой и более важная часть стажировок, особенно за границей. Общайтесь с другими студентами (не только со своей страны), более старшими людьми, посмотрите, что ещё происходит в городе. На сайтах по типу Meetup можно найти мероприятия, но порой есть и другие локально популярные площадки: фейсбук, инстаграм, линкедин, твиттер или что-то ещё. Влейтесь в местные тусовки и выясните как люди ищут ивенты. Очень много всего происходит в университетах. Я однажды сходил на хакатон в майкрософт (получилось больше вкусно покушать, чем поработать, если честно) и на какое-то карьерное мероприятие о Data Science. Сам ивент уже толком не помню, но познакомился там с человеком, с которым общаемся до сих пор и недавно увиделись вообще в другой стране. Помимо того, что это весело, бывает ещё очень полезно для карьеры

В целом, общение с людьми – это одна из самых ценных вещей в стажировках. Если не повезло с проектом, то даже ценнее, чем работа. Много узнаёшь про другие культуры, полезности для карьеры, порой организовываются путешествия и другие приключения. Не бойтесь выходить за рамки привычного: то, что было на стажировке, остаётся на стажировке 😉 Позже приключения вспоминаются и греют душу гораздо больше, чем средний рабочий день. А иногда иметь знакомых по всему миру бывает и полезно: например, когда нужно что-то оплатить за границей, а ваши карты превратились в тыкву, употребимую только по месту производства

Впрочем, у меня не такой большой опыт стажировок, как у некоторых читателей. Какими советами поделились бы вы?
человек наук
К статистике, особенно "официальной" всегда много вопросов. Собирать данные очень сложно, это не всегда делается корректно, а порой и намеренно фальсифицируется. Тем не менее, при большом количестве данных внезапно бывает кристально ясно видно интересные эффекты…
Пару дней назад в медиа была новость, что росстат почему-то решил закрыть для публики статистику смертей от внешних причин. Впрочем, авторы исследования пишут, что это не проблема: сотрудники росстата охотно поделились актуальными данными после запроса по почте. Необычайно высокая мужская смертность в 2023 году только усилилась: авторы оценивают количество избыточных смертей в 37860, больше 100 человек в день. Вместе с 2022 годом это даёт около 58500 смертей мужчин, которых не ожидалось по трендам в прошлом

#статистика
Встретил в одной из статей название клеточного типа в лёгких „Clara cells“. Стало интересно, что за Клара. Оказалось, что это не имя, а фамилия, а дальше события приняли очень мрачный оборот

Эти клетки были открыты в нацисткой Германии не скрывавшим свои антисемитские взгляды гистологом Максом Клара. Он приветствовал приход Гитлера к власти и призывал учёных „присоединиться к марширующим колоннам нашего лидера“. А образцы лёгких, в которых обнаружили новый клеточный тип, были получены от казнённых заключённых. Учёный отмечал, что „довольно обширный материал“ позволил ему сделать открытие быстрее конкурентов, а также проводил эксперименты по введению витамина C на по крайней мере одном приговорённом к смерти узнике 😐

Уже современные немецкие учёные в 2010 году удивились, что при такой мрачной истории открытия клеточного типа его название было в каждом учебнике. Кроме того, были открыты белки, специфичные для этого клеточного типа и названные в честь него же (например, CC16 – утероглобин, „CC“ означает „Clara Cells“). Учёные предложили не использовать „эпоним третьего рейха“ и заменить его на „Club cells“ – что-то вроде „булавоподобные“ или „куполоподобные клетки“, чтобы сохранить аббревиатуры. В английском языке это название прижилось, а вот статья в Википедии на русском всё ещё называется по-старому. На мой взгляд, она ещё и довольно странно структурирована, сперва вываливая на читателей ошеломляющую историю открытия, а потом как ни в чём ни бывало продолжая: „Главная функция клеток Клара – защита эпителия бронхиол“. Студенты-медики, подскажите, а как пишут в учебниках?

Фактов, полученных в подобных условиях, на самом деле немало. Но научным сообществом было принято решение не рассказывать истории их открытия: первооткрыватели явно не достойны чести. Рассказываю об этой только потому что её отголоски всё ещё можно встретить, а кое-где не помешало бы и устранить

#биология #история
Со мной в лаборатории работал PhD-студент, интересующийся определением причинности в данных. Можно ли, имея кучу наблюдений не просто найти ассоциации между признаками, а понять как они связаны причинно-следственно и как изменение одного влияет на другие? Особенно любопытно это было в контексте работы генов. Мы умеем получать данные об активности генов в куче клеток и даже ломать некоторые гены, чтобы посмотреть, что изменится. Можно ли тогда понять регуляторные связи? Если ответ положительный, можно лучше разобраться в устройстве жизни и предложить лечение некоторых болезней

Спустя какое-то время, этот студент разочаровался в данных: он решил, что они слишком шумные и понять ничего невозможно. А вот Hervé Isambert из института Кюри в Париже посвятил теме 10 лет и утверждает, что разобрался. Завтра в 6 вечера по московскому времени он расскажет о проблеме, методах и их применению к данным экспрессии и медицинским наблюдениям. Присоединяйтесь, слушайте и задавайте вопросы: это уникальная возможность! Подробнее прочитать о докладе и найти ссылку на видео-звонок можно здесь

UPD: встреча прошла, здесь можно посмотреть запись
человек наук
А вот как выглядит связь потребления кофе и часов сфокусированной работы. До 2 чашек чем больше я пью кофе, тем больше обычно работаю, но на 3 зависимость внезапно ломается и лишь самый продуктивный день дотягивает до медианного с двумя чашками кофе Оставлю…
А вот такое встретилось в данных, с которыми работаю сейчас. По оси Х – возраст пациентов, по Y – оценка здоровья лёгких, измеренная как максимальный объем воздуха, который человек может выдохнуть за секунду. Лёгкие обычно с возрастом работают хуже, но в группе бывших курильщиков (former, оранжевые точки) закономерность обратная: чем старше человек, тем лучше функция лёгких. Ваши теории, почему это так? Принимаются только неправильные ответы

#статистика #медицина
Продолжаем серию с подборкой старых статей списком удивительных математических явлений! И начнём с основ:

📝 Что такое математика
📝 Зачем нужна парабола
📝 Как решать квадратные уравнения

Освоили? Переходим к самому интересному:

📝 Геометрия футбольного мяча
📝 На Манхэттене π = 4
📝 Как связаны кролики и Парфенон?!

Если у вас закипели мозги, предлагаю дать им отдохнуть и прочитать эти статьи (отдых тоже должен быть созидательным, да-да):

📝 Забавные математические теоремы
📝 Самые интересные Шнобелевские премии
📝 Как вырастить величайшего хоккеиста 🔥

#математика #подборка_статей
Разрыв в ресурсах между академическими институтами и компаниями очень впечатляет. Заведующий крутой лабораторией публикует вакансию с фотографией системы из 8 топовых видеокарт от NVIDIA. В комментариях пишут, что это фото очень привлекательно для учёных, работающих с данными. Одна такая видеокарта стоит около 30 тысяч евро. Другой известный биоинформатикой институт пишет, что у них в кластере 150 видеокарт. Не самых крутых, а в целом.

У Меты 340 тысяч только топовых карт
Примеры обработок изображений алгоритмами донейросетевой эпохи – это что-то из фильмов ужасов

Отсюда

#программирование
В нашем институте хотели что-то построить, начали копать землю экскаватором и внезапно наткнулись на церковь, а затем и на целое поселение времени Раннего Средневековья, примерно 9-13 века. Теперь стройка, видимо, откладывается, зато копать начали ещё усиленнее, а археологи очень радуются находке. Вот такая концентрация науки: она не только окружает со всех сторон, но даже буквально находится под ногами

На фото древний PhD-студент пытается дождаться результатов эксперимента. Ну или один из жителей поселения, пока точно непонятно, ждём заключения археологов
Математическая задачка! В статье по изучению клеток при хронической обструктивной болезни лёгких учёные-медики собирали данные от нескольких групп пациентов, по 3 человека в каждой. Возраст людей в группах они указали в формате M ± S, где M – среднее, а S – стандартное отклонение. Зачем так делать, когда можно просто перечислить 3 числа, я не знаю, но это вопрос не по математике

Задача: укажите возраст пациентов в каждой группе, если данные для них такие:
1. 72 ± 2
2. 30 ± 4.36
3. 62 ± 11.53

Задачи расположены по возрастанию сложности. Первую легко решить в уме и у неё есть однозначный ответ. Другие чуть сложнее и у них может быть несколько ответов (но меньше, чем могли бы подумать математики)

Подсказка №1 (если забыли как считать M и S):
📝 Если возраст пациентов – X, Y и Z, то M = (X + Y + Z) / 3
📝 Удобнее работать не с S, а с дисперсией D = [(X - M)^2 + (Y - M)^2 + (Z - M)^2] / 2. Для того, чтобы получить стандартное отклонение, нужно взять из неё корень: S = √D


Подсказка №2:
📝 Возраст пациентов обычно указывается в годах. Это целые числа

Пишите ответы в комментариях, только прячьте их спойлером, чтобы не портить удовольствие другим людям :)

#математика
10-11 сентября в Москве будет проходить конференция "Клиническая диагностика и персонализированная медицина"

Участников ждут:
📃 Программа из 40 секционных докладчиков, 25 стендовых выступлений и 2 тематических круглых столов
🏅 Выставочная зона партнеров конференции
💙 Сувениры и подарки от организаторов и партнеров
🚀 Вакансии от передовых лабораторий и компаний
🍤 Еда
📍 Площадка проведения „РБК - Центр Событий“ в шаговой доступности от метро
🏘️ Комфортные гостиницы со скидкой для участников

Регистрация здесь
человек наук
Математическая задачка! В статье по изучению клеток при хронической обструктивной болезни лёгких учёные-медики собирали данные от нескольких групп пациентов, по 3 человека в каждой. Возраст людей в группах они указали в формате M ± S, где M – среднее, а S…
В комментариях прозвучали правильные ответы. А теперь сюжетный поворот: авторы сделали опечатку. В первой группе средний возраст — 73 года. Вот уж действительно, в трёх соснах заблудились

Если у вас так мало наблюдений в группах, не надо по ним считать средние, отклонения, корреляции и натальные карты. Просто напишите все числа!

#статистика
Для работы я веду список задач. Помимо описания, что нужно сделать, и приоритета, я также записываю сколько на неё примерно уйдёт времени. Это предсказание почти никогда не сбывается, но всё равно помогает планировать дни и смотреть, где сложность оценивается совсем неверно. Обычно ошибка составляет 10-50%, но недавно я промахнулся почти в 10 раз

Мы готовим иллюстрацию к статье и меня попросили сделать одно из изображений. Записав это в список задач, я оценил это дело на 3 часа. Как мне казалось – пессимистично: данные и графики-то все есть, осталось только поместить на картинку, выровнять и придумать подпись. В итоге на это ушло почти три рабочих дня. Вот что мы обсуждали с руководителем, может пригодится и вам:

📊 Какое сообщение несёт иллюстрация? Мы хотим не просто вывалить на читателей кучу данных, а сделать их частью понятной истории

📊 В идеале, каждая панель должна отвечать на какой-то вопрос (не обязательно озвученный). Между ними должны быть логические связи, создающие ответы на последовательные вопросы. Например: какие были данные? А какую построили модель? Как оценивали результат? И насколько хорошо получилось? Что нового мы узнали о предметной области благодаря этой модели? Отвечая на каждый вопрос при помощи иллюстрации, можно создать цельную и понятную историю

📊 После того как концепт проработан (это можно сделать в виде списка вопросов), связи между панелями выстроены и есть набросок, начинаются технические детали. Какие именно графики или схемы мы поместим на изображение? Можно ли сделать их проще? Ясно ли сообщение только из иллюстрации, если не читать подпись к ней и текст статьи (а большинство этого и не будет делать)? Понятны ли подписи и обозначения для людей с разным образованием?

📊 После создания первой версии мы просим других авторов статьи и людей из лаборатории посмотреть график (ничего по нему не поясняя) и сказать, что они из него поняли. Неясные моменты идут на доработку

📊 Позже будет доработка под журнал (там бывают требования по шрифтам и прочим деталям) и ревью от независимых исследователей. Несомненно что-то снова поменяется

Читая научные статьи, я и не представлял, сколько времени уходит на красивые картинки. Здесь я ещё не упомянул само построение графиков, которое тоже представляет отдельное искусство: какой тип графика выбрать, как подобрать цвета, будет ли это хорошо смотреться в чёрно-белой печати или для людей с особенностями зрения. В очередной раз поражаюсь как много всего должны уметь и держать в голове учёные

А как у вас принято работать над иллюстрациями?
Please open Telegram to view this post
VIEW IN TELEGRAM
Заменит ли ИИ программистов и причём здесь китовые оргии

Одним летним вечером очень захотелось смоделировать вымирание китов (у вас такого не бывает?). Начнём с простой модели: пусть киты случайным образом плавают по двумерному океану и при встрече производят нового кита. В жизни всё сложнее, но такая модель покажет важный факт: если животных будет достаточно много, они будут встречаться друг с другом часто и поддерживать популяцию. Если же китов станет мало, они могут умереть от старости прежде, чем встретят партнёра, и виду грозит вымирание. Это в теории, но на практике всё пошло не по плану

Сказано – сделано отправлено в чатгпт и уже через 10 секунд электронные киты весело плавают по голубому океану в окне браузера. Вот наконец происходит романтичное столкновение пары и… компьютер намертво зависает. Я повторил моделирование ещё пару раз, но результат был тем же: безграничная любовь морских млекопитающих не вмещалась в оперативную память. Пришлось лезть в код, чтобы разобраться (ужас, прошлый век, может ещё и писать самому?)

Оказалось, искусственный интеллект не слишком позаботился о естественных процессах. После рождения нового кита гордые родители не останавливались и продолжали плодить всё новых китят. Кроме того, тест на родителепригодность был максимально прост: если два животных находятся рядом, они производят потомство. Так как дети рождались сразу и в том же месте, они тоже проходили этот тест и, сливаясь в оргии со своими же родственниками, безостановочно плодили новых китов. Вымирание виду точно не грозило, а вот мой компьютер такой картины мог и не пережить

„Мда, нейросети пока не заменят программистов“, – подумал я, но в ответ на жалобу из всего двух слов – „браузер завис“ – чатгпт нашёл проблемное место, исправил ошибку и предложил возможные улучшения модели

А на следующий день я узнал, что киты и правда размножаются, устраивая оргии. Самец издаёт зов и самки сплываются посмотреть кто это такой громкий, а, раз уж приплыли, заодно и наделать новых китят. Получается, первоначальная модель была не так и далеко от правды?

#биология #программирование
Зачем использовать в речи конструкцию „Как вы все знаете…“? Если слушатели знают, про что говорится дальше, то эта фраза просто отнимает время. Если не знают, то в этот момент чувствуют себя глупыми. Можно просто выбросить эту фразу из речи и сделать её только лучше
Если Bio-яблоко стоит в полтора раза больше, чем просто яблоко, то почему Bio-информатикам платят в полтора раза меньше, чем просто информатикам?
человек наук
В одной из лабораторий, где я работаю, был человек, который каждое утро присылал список новых статей из нашей научной области. Каждый день он смотрел рассылки, фильтровал релевантные публикации и собирал их в сообщение. В нашей области (разработка вычислительных…
По просьбам подписчиков появилось ещё несколько каналов с ежедневными подборками статей. Если кому-то ещё пригодится – пользуйтесь на здоровье 🙂

Computational methods for single-cell data

Computational structural biology

Antibody design

Protein Design and ML in proteomics

Multiomics and AI for drug discovery

Image-based cell profiling

Epigenetic clock algorithms

Brain transcriptomic and epigenetics

Population genomics

Ancient DNA and ancient metagenomics

Microbiome and virome of ixodid ticks and malaria mosquitoes

Chromaffin tumors and Adrenocortical cancer

Extracellular vesicles, exosomes, and microvesicles

Neurofibromatosis and genotype-phenotype correlation

Cattle selection

Quantum chemistry, DFT, coacervate catalysis, and ML in chemistry

STR-based molecular genetic identification

ML in survival analysis and cancer biomarkers

А также всегда можно написать админу, чтобы заказать подборку по своим интересам. Поддержка ботов требует денег, а настройка – времени, поэтому буду благодарен поддержке. Пока не знаю как это организовать, но можно присылать звёзды в телеграме

Пост будет обновляться. Также работаем над тем, чтобы сделать код открытым
Ставить у компьютера кактус для защиты от излучения – это прошлый век. Современные программисты ставят венерину мухоловку для поимки багов
2025/02/25 03:52:08
Back to Top
HTML Embed Code: