CAS COVID-19抗ウイルス薬候補SARデータセット

COVID-19抗ウイルス薬化合物SARデータセットバナー

このオープンソースのデータセットには、CAS COVID-19抗ウイルス薬候補化合物データセットに含まれる9万件以上の物質についての文献、特許、その他の公的情報源で報告されているCOVID-19のタンパク質、ウイルス、疾患のターゲットに焦点を当てた、29万件以上の構造活性相関(SAR)データが含まれます。 

科学情報ソリューションの専門家であるCASは、世界中の研究組織と協力して、急速に拡大しているCOVID-19の複雑かつ困難を極める課題の解決に取り組んでいます。米国化学会(ACS)の一部門としての使命に沿って、この疾患と戦うために、CASは広範囲の情報資産、専門知識、リソースを提供します。

この取り組みの一環として、CASは文献、特許、その他の公的情報源で報告されているCOVID-19のタンパク質、ウイルス、疾患のターゲットに焦点を当てた、29万件以上の構造活性相関(SAR)データに関するオープンソースのデータセットを構築しました。このデータセットは、CAS COVID-19抗ウイルス薬候補化合物データセットと共にご利用ください。 データセットのライセンス契約では、研究、データマイニング、機械学習、アナリティクスを含む用途でのアプリケーションの無償利用を支援しています。

このデータセット(とreadmeファイル)は以下のフォームにご記入の上、ダウンロードできます 


データセットについて

このデータセットは.csv(コンマ区切り値)ファイル形式となっており、IC50、EC50、その他の有用なメトリックスを含む29万件以上の構造生物活性データポイントを含みます。CSVファイル形式はMicrosoft Excelなどの表計算ツールにすぐデータとしてインポートできます。データは列ヘッダー(cas_rn、protein、therapeutic use、activity type、activity value、activity unit、source)により整理されています。無料ソフトウェアであるSciKit-Learnなどのデータサイエンスツールの場合、Pythonプログラミング言語を使うことで、データセットを機械学習に展開する際にPandasライブラリデータフレームを検討できます。


COVID-19関連の研究や分析を支援する追加データやサービスの申請が必要な場合やご質問がある場合は、CAS カスタマーセンターまでご連絡ください。


その他のCAS COVID-19関連リソース


 

データセットのダウンロード

Your privacy is important to CAS. More detail about how we use your information is in our privacy policy.



Contact CAS

Let us know how we can best serve you.