O banco de dados de sítios alostéricos foi construído a partir lista de arquivos descarregada do site da base de dados ASD (AlloSteric Database), disponível em https://mdl.shsmu.edu.cn/ASD/, contendo informações sobre as proteínas com sítios alostéricos. Usando essa lista, buscamos no PDB as proteínas cujas estruturas têm resolução melhor que 2.5 Å. Essa filtragem resultou em 7684 estruturas, e para cada uma delas foram calculados os descritores físico-químicos e estruturais da plataforma STING, distribuídos em 108 tabelas do banco de dados relacional. O objetivo desse conjunto de dados é identificar, baseado nesses descritores, os resíduos de aminoácidos pertencentes ao sítio alostérico dessas proteínas. Essa informação é importante, uma vez que a alosteria é pertinente para regular a atividade funcional de uma proteína induzida pela ação de um efetor em um sítio distinto do sítio ativo de biomoléculas através de alteração de conformação e/ou dinâmica.
Os dados estão disponibilizados no formato CSV. O usuário pode trabalhar com um conjunto de dados separado, ou pode unir os arquivos. Não há uma sequência lógica para ele fazer isso, pode seguir a ordem alfabética, se quiser.
The allosteric sites database was constructed from a list of files downloaded from the ASD database website (AlloSteric Database), available at https://mdl.shsmu.edu.cn/ASD/, containing information about proteins with allosteric sites. Using this list, we searched the PDB for proteins whose structures have a resolution better than 2.5 Å. This filtering resulted in 7684 structures, and for each of them the physical-chemical and structural STING plataform descriptors were calculated, distributed across 108 tables in the relational database. The objective of this dataset is to identify, based on these descriptors, the amino acid residues belonging to the allosteric site of these proteins. This information is important, since allostery is pertinent to regulate the functional activity of a protein induced by the action of an effector in a site distinct from the active site of biomolecules through changes in conformation and/or dynamics.
The data is available in CSV format. The user can work with a separate dataset, or can merge the files. There is no logical sequence for him to do this, you can follow the alphabetical order if you want.