Genética Populacional: R

Mostrando postagens com marcador R. Mostrar todas as postagens

Funções no R

#######################
## Funções Matemáticas
log( 10 )
# Logaritmo natural
log( 10, base = 10) # Log base 10
log10(10)
# Também log de base 10
log( 10, base = 3.4076) # base 3.4076

############################
#Constante de funções trigonométricas
sin(0.5*pi) # Seno
cos(2*pi) # Coseno
asin(1) # Arco seno (radianos)
asin(1) / pi * 180

#############################
1 - (1 + 10^(-15))
factorial(100) # Fatorial de 100

#############################
## arredondamentos
round( 4.3478 )
round( 4.3478 , digits=3)
round( 4.3478 , digits=2)

#######################################
#Valores Infinitos, Indefinidos e Inexistentes
-5/0
500000000000000000/Inf
2 * NA

#########################
#Vetores
a = c(3.4, pi, exp(-1))
a1= c(3.4,pi, "a")
a2= c(3.4,pi, a)
a1
a2
#Sequências
b = 1:8
b
seq(from=1, to=4)
seq(from=1, to=4, by=0.5)
seq(from=1, to=4, length=6)
## Sequencias com padrão
rep(5, times=3)
rep(1:5, 3)
rep(1:5,each=3)

####################
#Operações com vetores
a = seq(0,8,2)
a
b = c(1,15,18,3,6)
a+b
a^(1/b)
length(b)/length(a)
b
sort(b)
sort(b, decreasing=T)

#######################################

Inserindo dados no R

#######################
##Inserindo dados
# Leitura de dados TXT separado por tabulação com read.table
df <- read.table("https://s3.amazonaws.com/assets.datacamp.com/blog_assets/test.txt", header = FALSE)
# Verificar o arquivo
df
# Leitura de dados CSV com read.csv
df <- read.table("https://s3.amazonaws.com/assets.datacamp.com/blog_assets/test.csv", header = FALSE, sep = ",")
df <- read.csv("https://s3.amazonaws.com/assets.datacamp.com/blog_assets/test.csv",
header = FALSE)
# Simbolo separador é a vírgula
# O argumento header (cabeçalho) é TRUE, significando que a primeira linha corresponde aos nomes das variáveis
# O argumento fill é TRUE e todos os campos não preenchidos serão adicionados
# Verificar o arquivo
df
# Leitura de dados TXT separado por outros símbolos com read.delim
df <- read.delim("https://s3.amazonaws.com/assets.datacamp.com/blog_assets/test_delim.txt", sep="$")
df <- read.delim2("https://s3.amazonaws.com/assets.datacamp.com/blog_assets/test_delim.txt", sep="$")
# Verificar o arquivo
df

# Colocar dados diretamente no R
area <- c(303, 379, 961, 295, 332, 47, 122, 11, 53, 2749)
riqueza <- c(3, 10, 20, 7, 8, 4, 8, 3, 5, 23)
area
riqueza
summary(area)
summary(riqueza)
mean(x=area)
var(area)
sd(x=area)
mean(riqueza)
var(riqueza)
sd(riqueza)
plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies")
modelo1 <- lm(riqueza~area)
plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies")
abline(modelo1)
plot(x=area, y=riqueza, xlab="Log Area (ha)", ylab="Log Número de Espécies", log="xy")
modelo2 <- lm(log(riqueza,base=10)~log(area,base=10))
abline(modelo2)
#######################

Adegenet

Este pacote do R implementa ferramentas para analisar e simular dados genéticos. Originalmente desenvolvido para dados multialélicos, marcadores co-dominantes, como os microssatélites, adegenet agora também lida marcadores dominantes e permite qualquer ploidia nos dados. O implemento de mais memória e armazenagem de dados permite a análise de todo o genoma com SNPs.

É o programa mais completo para análise de dados populacionais no R.

adegenet armazena os dados genotipicos usando a classe S4 "genind":
Indivíduos nas linhas e alelos nas colunas em uma matriz chamada "tab", cada alelos é representado por 2 colunas.
Os elementos são acessados com o operados @ (e.g., x@tab). Informações adicionais são armazenadas em outros espaços (@ind.names, @pop, . . . )
Mais detalhes sobre a classe podem ser acessados pelo comando:
class?genind

Polysat

Esse pacote do R fornece ferramentas úteis para trabalhar com dados de microssatélites de qualquer nível de ploidia, incluindo populações de ploidia mista. O pacote pode converter dados de genótipos entre diferentes formatos, incluindo Applied Biosys-tems GeneMapper®, dados binários de presença / ausência, Tetra / Tetrasat, GenoDive, SPAGeDi, STRUCTURE, POPDIST, e Strand. Também pode calcular distâncias genéticas final entre as amostras, auxiliar o usuário na estimativa ploidia com base no número de alelos, e estimar as freqüências alélicas e FST. devido para a versatilidade do ambiente de programação R e a simplicidade de como genótipos são armazenados pelo polysat, o usuário poderá usar muitas outras funções do R, tais como coordenadas principais Análise ou AMOVA.

Clique aqui para acessar a página contendo exemplos

PopGenReport

Este pacote do R tem como objetivo a análise de dados de genética de população (apenas dados de microssatélites). Também apresenta análises mais sofisticadas de dados genéticos populacionais espaciais. Este pacote inspira-se fortemente em pacotes já existentes, tais como adegenet, MMOD, pegas e outros.

Clique aqui para acessar a página de download

Poppr

Poppr é um pacote de R para análise de dados genéticos populacionais. Poppr apresenta funções essenciais para a análise de populações com modos mistos de reprodução normalmente observados para as populações microbianas, incluindo uma mistura de reprodução assexual e sexual. Poppr permite a análise hierárquica conveniente de populações com vários níveis subpopulação, clone censura, análise de distância (incluindo a distância de Bruvo), incluindo dendrogramas com suporte de bootstrap, desequilíbrio de ligação e muito mais.

Clique aqui para acessar a página de download

HIERFSTAT

HIERFSTAT é um pacote para R permitindo estimar F-estatísticas e componentes de variância com os métodos de momentos para qualquer número de níveis em uma hierarquia. O pacote também permite testar a significância da diferenciação população que utiliza a probabilidade relação G-estatística ou os componentes de variância

Clique aqui para acessar a página de download

Páginas