Российский химико-аналитический портал | химический анализ и аналитическая химия в фокусе внимания ::: портал химиков-аналитиков ::: выбор профессионалов |
|
ANCHEM.RU » Форумы » 1. Аналитический форум ... |
Покритикуйте, пожалуйста, нашу бесплатную базу на пол миллиарда конформеров >>>
|
Автор | Тема: Покритикуйте, пожалуйста, нашу бесплатную базу на пол миллиарда конформеров | ||
igorchem Пользователь Ранг: 333 |
23.12.2020 // 1:56:34
Добрый день, предлагаю Вашему вниманию предварительный релиз базы данных химических веществ с поиском по функциональным группам, на данный момент в ней 103 миллиона молекул и около 500 миллионов конформеров, которая основана на данных PubChem и которую мы планируем сами дополнять новыми данными и расчетами. https:// Мы планируем эту базу всегда поддерживать бесплатно у нас на сайте. С радостью выслушаю критику, замечания, отзывы, советы. Спасибо! С уважением и с наступающими Новогодними праздниками! PS: знаю, что с некоторых адресов из РФ почему-то наш сайт блокируется, поделитесь, пожалуйста, информацией, если Вы это уведите |
||
ANCHEM.RU Администрация Ранг: 246 |
|||
Avet Пользователь Ранг: 1086 |
23.12.2020 // 9:50:08
Редактировано 1 раз(а) Добрый день! Объясните, пожалуйста, как пользоваться. Я даже попытался что-то ввести, но программа не отозвалась |
||
voodensky Пользователь Ранг: 531 |
23.12.2020 // 9:58:51
А какие задачи она решает? Вот, например, ввожу ограничение по массам от 194 до 194 и хочу увидеть кофеин. Но вижу только "Nothing is found". Неужели в базе из 103 млн молекул нет кофеина? |
||
igorchem Пользователь Ранг: 333 |
23.12.2020 // 12:56:32
Спасибо большое за отзыв! не, надо хотя бы один атом указать, а массы надо в плавающей точке задавать, ибо у кофеина чуть больше 194 масса. Я бы делал так, ввел вначале C8 N4 O2 H10 и массы от 193 до 195. Далее у меня получилось очень много вариантов кофеина и не только. Перешел бы на Auxilary Search, и повторил бы там поиск, а там, найдя первую структуру кофеина с изотопами нажал бы Import to Main Search с опцией X Hydrogen, и повторил бы поиск. В этом случае нашлось больше 50 вариантов кофеина, но которые только изотопами отличаются. С хелпом - согласен - пока написал заумно. Основной смысл поиска - в auxilary search ищем или остов или набор функциональных групп, а потом уже ищем в основном поиске. |
||
igorchem Пользователь Ранг: 333 |
23.12.2020 // 15:20:36
Спасибо большое за отзыв! Поправил форматы, и хелп. Ключевая идея при поиске - это вначале выбрать те функциональные группы, что есть в молекуле для поиска, и потом сделать такой поиск. Например, мы хотим найти все, что содержит COOH, CH3, NH2 группы и имеет не много атомов. В этом случае вводим поочередно в Auxilary Search 1. COOH , выбираем Import to Main Search, тогда в Functional Groups добавляется CID номер 54723866, 2. CH3 , выбираем Import to Main Search, тогда в Functional Groups добавляется CID номер 3034819, 3. NH2 , выбираем Import to Main Search, тогда в Functional Groups добавляется CID номер 5460608, Теперь мы хотим найти молекулы, которые содержат эти функциональные группы (в Functional Groups у нас из-за вспомогательного поиска осталось 54723866,3034819,59342537) , причем мы хотим найти молекулы, у которых есть от 2 до 8 атомов углерода и от 1 до 5 атомов фтора, тогда в первой строке мы запишем: C2-8 F1-5 и нажимаем поиск. Получается 11 молекул. У тех, у которых есть конформеры, при переключении на конформеры Вы можете мышкой повернуть и посмотреть на молекулу с разных сторон. |
||
gingerino Пользователь Ранг: 207 |
23.12.2020 // 18:47:33
Редактировано 1 раз(а) Спасибо большое за ваш труд! А есть возможность по CAS номерам искать? Или ПАБкем?? |
||
Каталог ANCHEM.RU Администрация Ранг: 246 |
|
||
igorchem Пользователь Ранг: 333 |
23.12.2020 // 19:30:28
Спасибо большое за отзыв! С радостью вникну во все пожелания, и постараюсь их выполнить.
По PubChem - это как раз по номеру CID, в четвертой строчке сверху. Можно перечислить несколько CID, можно использовать CID во вспомогательном поиске, чтобы потом искать молекулу, у которой есть такие же атомы (без учета типа связи и/или без учета водородов). Вот по CAS - я пока не нашел где найти в открытом доступе таблицу сопоставления PubChem - CAS, если вдруг кто-то знает, где такая таблица имеется, то CAS мы сразу добавим. |
||
SergeyK Пользователь Ранг: 2168 |
24.12.2020 // 2:07:18
знаю, как по CAS получить список CID по REST: GET { "IdentifierList": { "CID": [ 2244 ] } } |
||
igorchem Пользователь Ранг: 333 |
24.12.2020 // 2:20:01
Спасибо большое, SergeyK, да, такой метод работает, только примерно один запрос в секунду (я только что в цикле с нашего сервера это попробовал). Жалко, что только за 5 лет все вытащится. Возможно можно Substances правильно парсить, но не факт, что там вся необходимая информация имеется. |
||
SergeyK Пользователь Ранг: 2168 |
24.12.2020 // 2:25:18
По CID получить список CAS: GET https://cts.fiehnlab.ucdavis.edu/rest/convert/PubChem%20CID/CAS/2244 [ { "fromIdentifier": "PubChem CID", "toIdentifier": "CAS", "searchTerm": "2244", "results": [ "11126-35-5", "156865-15-5", "50-78-2", "99512-66-0" ] } ] |
||
SergeyK Пользователь Ранг: 2168 |
24.12.2020 // 2:26:24
|
|
||
|
ЖУРНАЛ | ЛАБОРАТОРИИ | ЛИТЕРАТУРА | ОБОРУДОВАНИЕ | РАБОТА | КАЛЕНДАРЬ | ФОРУМ |
Copyright © 2002-2022 «Аналитика-Мир профессионалов» |
Размещение рекламы / Контакты |