Związkami chemicznymi są substancje o określonym typie połączenia różnych atomów, to jest posiadające strukturę, układ wiązań i wartościowości atomowych charakterystyczne dla niego, i powtarzalne w kolejnych porcjach. Liczba możliwych kombinacji atomów, już dla ich niewielkiej ilości, jest przeogromna. Dla składu pierwiastkowego C10 H22 możliwych jest 75 związków, różniących się tylko sposobem połączenia atomów węgla.[1] Wraz z ilością atomów węgla liczba izomerów gwałtownie rośnie, a to przecież tylko połączenia dwóch pierwiastków. Wszystkich pierwiastków na tyle trwałych, aby można było nimi operować jest ponad 90. Potencjalnie możliwych połączeń nawet przy ograniczonej ilości atomów jest niemal tyle, co gwiazd na niebie.
Z drugiej strony pewne połączenia, które da się wymyślić, niekoniecznie muszą mieć szansę faktycznie zaistnieć. Ze względu na kolejność łączenia się atomów pewne najbardziej naprężone, wykręcone czy zabudowane przestrzennie cząsteczki po prostu się nie utworzą. Hipotetyczny tetra-tertbutylometan nie został dotychczas zaobserwowany, ze względu na bycie bardzo ścisłą węglowodorową kulką, w której duże grupy organiczne wzajemnie sobie przeszkadzają i już podstawienie trzech nie zostawia za wiele miejsca na podejście czwartej.
Tetra-tertbutylometan |
Beilstein
Baza danych Beilstein gromadzi informacje o związkach, które wyizolowano w stanie czystym i zbadano właściwości oraz podano informacje spektroskopowe. Inaczej mówiąc, są to związki, których istnienie i właściwości zostały dobrze potwierdzone. Baza początkowo opierała się o związki opisane w "Beilstein Handbook of Organic Chemistry" wydawanym w Niemczech od 1778 roku, potem o związki opisane w najważniejszych światowych czasopismach naukowych.
Baza zgromadziła już informacje o około 6 milionach związków organicznych i 5 milionów reakcji w których się pojawiają. Dostęp do bazy odbywa się przez serwis Reaxys wymagający logowania, udostępniany pracownikom naukowym.
Gmelin
Pokrewna Beilsteinowi baza danych na temat związków nieorganicznych i organometalicznych. Zebrała informacje o 2,4 miliona związków.
Chem Spider
Ogólnodostępna bada danych na temat związków chemicznych, które dobrze zbadano. Z tego co zaobserwowałem, często można tam znaleźć więcej danych fizycznych niż podane w innych bazach, pełnych pustych rubryk. Zawiera informacje o około 65 milionach związków.
PubChem
Baza służąca do wyszukiwania informacji o związkach chemicznych, ich właściwościach, publikacjach w których się pojawiały, patentach itp. Jest to właściwie połączenie wiadomości z różnych baz. Dostęp jest darmowy, możliwe jest szukanie związków na podstawie rysunku strukturalnego, ograniczeniem jest tylko wielkość cząsteczki poniżej 1000 atomów.
Baza zawiera informacje o wyizolowanych, zbadanych i scharakteryzowanych związkach (około 94 miliony), oraz bardziej nieprecyzyjne dane na temat "substancji" do czego zaliczają się na przykład mieszaniny, kompleksy i nie do końca scharakteryzowane substancje. Tych zapisów jest 236 milionów.
CAS
Chemical Abstracts to wydawnictwo zbierające abstrakty - krótkie streszczenia mówiące o czym jest i co zawiera artykuł naukowy. Pozbierane zostały ze wszystkich ważniejszych czasopism, udostępniających anglojęzyczne abstrakty. Na podstawie tego zbioru utworzono katalog opisanych związków chemicznych, w którym każdemu przypisuje się numer - numer CAS. Ma on format trzech liczb oddzielonych myślnikami: XXXX-YY-Z. Pierwsza liczba może zawierać od dwóch do siedmiu liczb, druga zawiera dwie, zaś ostatnia jedną, jest to zresztą suma kontrolna pomagająca pilnować czy nie doszło do błędu w zapisie.
Podejście twórców do jakości danych jest nieco bardziej liberalne niż u Beilsteina - wystarczy że związek został opisany i scharakteryzowano jego skład i budowę. W bazie znalazły się związki organiczne, nieorganiczne, pierwiastki, niektóre wyraźnie różne alotropy, stopy metaliczne, interkalacje, klatraty itp. Jest to więc baza wszystkich opisanych substancji chemicznych.
Dla wielu związków szukanie na ich temat informacji czy publikacji jest łatwiejsze, jeśli szuka się po numerze CAS, niż po nazwie systematycznej - a ta potrafi być długa i skomplikowana.
W bazie jak na razie zgromadzono 144 miliony związków chemicznych, oraz 67 milionów protein, enzymów i sekwencji DNA.[2]
Te bazy oczywiście nie wyczerpują całego zasobu istniejących substancji. Ciągle bada się przyrodę, odkrywając w niej nowe związki. W substancjach smolistych niecałkowitego spalania z pewnością pojawiają się jeszcze nieopisane formy węglowodorów aromatycznych. Są też związki zsyntezowane i scharakteryzowane, które opisano w tak nieznaczących miejscach, że żadna baza ich nie zawiera. Wreszcie - każdy z nas posiada w sobie unikalny związek chemiczny - własne DNA. Każdy człowiek to nowa cząsteczka, a tych przecież przybywa.
Nigdy nie doliczymy się wszystkich.
----------
* CAS
* Beilstein
* Pub Chem
* Chem Spider
* http://old.enea.it/com/inf/biblioteche/DiscoveryGate/Databases.pdf
[1] http://www.3rd1000.com/chem301/decane.htm
[2] https://www.cas.org/about/cas-content