Escolhendo enzimas de restrição adequadas com base em critérios definidos

A fim de proceder com um exemplo conciso, a proteína fluorescente tdTomato foi clonada em um vetor alfaretroviral. Consecutivamente, foi gerada uma linha celular de leucemia murina expressando o tdTomato. Esta linha celular será utilizada para rastrear células tumorais após a injeção em ratos em estudos de imunoterapia pré-clínica. Entretanto, este método de clonagem é aplicável a qualquer outro gene. Para iniciar o projeto de clonagem, o gene de interesse (GOI) deve ser analisado. Primeiro, verificamos se a nossa sequência anotada tem um códon inicial (ATG, o códon inicial mais comum) e um dos três códons parados (TAA, TAG, TGA). Caso o gene tenha sido previamente manipulado ou fundido a outro gene (por exemplo, através de uma sequência 2A), acontece que um gene de interesse pode não ter um códon de paragem. Nesses casos, um códon de parada precisa ser adicionado ao final da sua sequência anotada. Também é benéfico investigar se o seu GOI contém um quadro de leitura aberto (ORF). Isto é importante uma vez que a manipulação frequente de sequências quer por software quer por clonagem pode adicionar ou apagar nucleótidos erroneamente. Nós usamos o software Clone Manager (SciEd) para encontrar ORFs nas nossas sequências plasmídeas; no entanto, existem vários sites gratuitos que você pode usar para encontrar ORFs incluindo o NCBI open reading frame finder (http://www.ncbi.nlm.nih.gov/gorf/gorf.html).

O gene tdTomato contém o códon de início ATG e o códon de parada TAA (Figura 1). O tamanho do gene tdTomato é 716 bp.

Figure 1
figure1

Visão geral do início e do fim do gene de interesse. (A) As sequências nucleotídicas no início e no fim do gene tdTomato são mostradas. Os nucleótidos da cadeia de codificação são especificados em negrito (B) As sequências de nucleótidos dos iniciadores de PCR que contêm os sítios apropriados de enzimas de restrição e a sequência Kozak são mostrados.

Num próximo passo, os iniciadores de PCR que incluem sítios apropriados de enzimas de restrição têm de ser concebidos para a amplificação do GOI. Vários critérios devem ser considerados a fim de escolher as enzimas de restrição óptimas. Primeiro, os locais de ligação para as enzimas de restrição devem estar idealmente disponíveis num local de clonagem múltipla dentro do vector. Alternativamente, elas podem ser localizadas a jusante do promotor na sua sequência vectorial. As enzimas de restrição devem ser cortantes simples (cortantes simples visam apenas um local de restrição dentro de uma sequência de DNA) (Figura 2A). Se forem cortadores duplos ou múltiplos, eles devem cortar dentro de uma sequência que não seja necessária para o bom funcionamento do plasmídeo vectorial e serão finalmente removidos (Figura 2B). Também é possível escolher uma fresa dupla ou múltiplas enzimas de corte cortando o vector a jusante do promotor e também não dentro de uma sequência vital do plasmídeo (Figura 2C). As enzimas de corte duplo ou múltiplo têm dois ou mais locais de restrição em uma seqüência de DNA, respectivamente. O corte do vector com cortadores duplos ou múltiplos daria origem a duas extremidades idênticas. Nesse caso, o cassete de inserção também deve conter os mesmos sítios de restrição enzimática em ambas as suas extremidades. Portanto, quando a pastilha e os fragmentos vectoriais são misturados numa experiência de ligação, a pastilha pode fundir-se ao vector na orientação correcta (do códão de início ao códão de paragem) ou inversamente (do códão de paragem ao códão de início). Um terceiro cenário pode ocorrer, se o fragmento vectorial formar um círculo auto-ligante omitindo de todo o insert. Uma vez o ADN incubado com enzimas de restrição, a desfosforilação das extremidades do plasmídeo vectorial 5′ e 3′ usando uma enzima de fosfatase alcalina irá reduzir grandemente o risco de auto-ligação. É por isso importante fazer a triagem de um produto de clonagem para estes três produtos (orientação direita, orientação inversa, auto-ligação) após a ligação dos fragmentos.

Figure 2
figure2

Escolher enzimas de restrição adequadas com base em critérios definidos para a clonagem por PCR. (A) Duas enzimas de restrição de um único cortador (E1 e E2) estão localizadas a jusante do promotor. (B) As enzimas de restrição E1 e E2 cortam o plasmídeo a jusante do promotor várias (aqui duas vezes para cada enzima) vezes. (C) A enzima de restrição E1 corta o plasmídeo a jusante do promotor mais de uma vez. (D) O produto PCR, que contém o gene tdTomato e os locais da enzima de restrição, foi executado num gel antes de ser extraído para aplicações a jusante.

Segundo, devido à maior eficiência de clonagem usando fragmentos de DNA pegajoso, é desejável que pelo menos uma (melhor ambas) das enzimas de restrição seja um chamado cortador pegajoso. Os cortadores de extremidade pegajosa clivam o DNA assimetricamente gerando extremidades coesivas complementares. Em contraste, os cortadores de extremidade romba cortam a sequência simetricamente, não deixando nenhuma sobreposição. A clonagem de fragmentos de extremidade romba é mais difícil. No entanto, escolhendo uma relação molar inserto/vetor mais alta (5 ou mais) e o uso de 10% de polietilenoglicol (PEG) pode melhorar a ligação dos fragmentos rombos.

Terceiro, algumas enzimas de restrição não cortam o DNA metilado. A maioria das estirpes de E. coli contém metilases de Dam ou Dcm que metilam sequências de ADN metilado. Isto torna-as resistentes às enzimas de restrição sensíveis à metilação. Uma vez que o ADN vectorial é maioritariamente preparado em E. coli, este será metilado. Portanto, é desejável evitar enzimas de restrição sensíveis à metilação; contudo, às vezes o isosquizômero de uma enzima de restrição sensível à metilação é resistente à metilação. Por exemplo, a enzima Acc65I é sensível enquanto o seu isosquizômero kpnI é resistente à metilação. Os isosquizômeros são enzimas de restrição que reconhecem as mesmas sequências de nucleotídeos. Se não houver outra opção a não ser usar enzimas de restrição sensíveis à metilação, o DNA vetorial precisa ser preparado em cepas de dam – dcm – E. coli. Uma lista destas estirpes e também das estirpes hospedeiras comuns de E. coli para clonagem molecular está resumida na Tabela 1. Informações sobre a sensibilidade à metilação das enzimas de restrição são normalmente fornecidas pelo fabricante.

Quadro 1 Cepas hospedeiras comuns de E. coli na clonagem de genes

Quarto, facilita a clonagem se o tampão necessário para a plena funcionalidade das enzimas de restrição for o mesmo, pois é possível realizar a digestão de restrição dupla. Isto poupa tempo e reduz a perda de DNA durante a purificação. Pode acontecer que uma das enzimas de restrição esteja ativa em um tampão e a segunda enzima esteja ativa no dobro da concentração do mesmo tampão. Por exemplo, a enzima NheI da Thermo Scientific é ativa no tampão Tango 1X (Thermo Scientific) e a enzima EcoR1 é ativa no tampão Tango 2X (Thermo Scientific). Nesses casos, o DNA plasmídeo precisa ser primeiro digerido pela enzima que requer a maior concentração de tampão (aqui EcoR1). Isto será seguido pela diluição do tampão para a próxima enzima (exigindo uma concentração menor (aqui NheI)) no mesmo tampão. Entretanto, o surgimento de tampões universais simplificou a digestão dupla das sequências de DNA. No nosso exemplo, o vector contém os sítios de restrição de AgeI e SalI. Estes locais enzimáticos foram utilizados para a concepção de iniciadores de PCR (Figura 1). É essencial para uma digestão adequada das enzimas de restrição que a pureza plasmídica seja elevada. A absorção de ADN medida por um espectrofotómetro pode ser utilizada para determinar a pureza após a purificação. O DNA, proteínas e solventes absorvem a 260 nm, 280 nm, e 230 nm, respectivamente. Uma razão OD 260/280 de >1,8 e uma razão OD 260/230 de 2 a 2,2 é considerada pura para amostras de DNA. As relações OD 260/280 e 260/230 das nossas preparações plasmídicas exemplares foram de 1,89 e 2,22, respectivamente. Observamos que a pureza do vector extraído em gel e dos fragmentos de ADN inserido foi menor após a digestão de restrição; a ligadura funciona mesmo nesses casos, no entanto, melhores resultados podem ser esperados usando fragmentos de alta pureza.

O seguinte site do repositório de plasmídeos pode ser útil para a seleção de diferentes vetores (expressão viral e embalagem, backbones vazios, proteínas fluorescentes, vetores induzíveis, tags epitópicos, proteínas de fusão, genes repórteres, sistemas de expressão específicos da espécie, marcadores de seleção, promotores, expressão de shRNA e engenharia do genoma):http://www.addgene.org/browse/.

Uma colecção de vectores de clonagem de E. coli está disponível no seguinte website:http://www.shigen.nig.ac.jp/ecoli/strain/cvector/cvectorExplanation.jsp.

Desenho de primers de clonagem baseados em critérios definidos

Para o desenho de primers de PCR, verifique os códones de início e fim do seu GOI. Encontre a sequência das enzimas de restrição desejadas (disponíveis nos websites dos fabricantes) para o primer forward (Figura 3A). Precisa de ser localizado antes do GOI (Figura 1B). A chamada sequência Kozak é encontrada nos mRNAs eucarióticos e melhora o início da tradução. É benéfico adicionar a sequência de Kozak (GCCACC) antes do códon inicial do ATG, pois aumenta a translação e expressão da proteína de interesse em eucariotas. Portanto, inserimos GCCACC imediatamente após a sequência enzimática de restrição AgeI e antes do códon inicial do ATG. Em seguida, os primeiros 18 a 30 nucleotídeos do GI a partir do códão de início ATG são adicionados à sequência de primer forward. Estes nucleotídeos sobrepostos ligados ao ADN modelo determinam a temperatura de recozimento (Tm). Esta última é normalmente superior a 60°C. Aqui usamos a Phusion high-fidelity DNA polimerase (Thermo Scientific). Pode utilizar os seguintes websites para determinar a Tm:http://www.thermoscientificbio.com/webtools/tmc/.

Figure 3
figure3

Projetando primers baseados em critérios definidos para clonagem por PCR. (A-B) São representadas as sequências do primer para a frente e do primer invertido. O fim do fio de codificação deve ser convertido no formato do complemento inverso para o desenho do primer invertido. Para mais informações, consulte o texto.

https://www.neb.com/tools-and-resources/interactive-tools/tm-calculator.

O Tm do nosso primer para a frente é 66°C.

Selecionar os últimos 18 a 30 nucleótidos incluindo o códon de paragem do seu GOI para o desenho do primer inverso (Figura 3B). Depois calcule o Tm para esta sequência que deve estar acima dos 60°C e próximo do Tm do primer da frente. O Tm da sequência de sobreposição do nosso iniciador invertido era de 68°C. Em seguida, adicione a sequência alvo do segundo local da enzima de restrição (neste caso, SalI) imediatamente após o códão de paragem. Finalmente, converta esta sequência montada para uma sequência de sobreposição inversa. Os seguintes sites podem ser usados para determinar a seqüência do primer reverso:

http://reverse-complement.com/

http://www.bioinformatics.org/sms/rev_comp.htmlThis é importante uma vez que o primer reverso liga a cadeia de codificação e, portanto, sua seqüência (5′ → 3′) deve ser reverso-complementar à seqüência da cadeia de codificação (Figura 1A).

Executar PCR usando polimerases de revisão

Desde que a reacção PCR siga a amplificação logarítmica da sequência alvo, qualquer erro de replicação durante este processo será amplificado. A taxa de erro das polimerases de DNA não-retritoras, como a Taq polimerase, é cerca de 8 × 10-6 erros/bp/ cicloPCR; contudo, enzimas de revisão como a Phusion polimerase têm uma taxa de erro reportada de 4,4 × 10-7 erros/bp/ cicloPCR. Devido à sua superior fidelidade e processabilidade, a Phusion DNA polimerase foi usada neste exemplo. Deve-se notar que a Phusion tem requisitos de temperatura diferentes de outras polimerases de DNA. O primer Tm para Phusion é calculado com base no método de Breslauer e é superior ao Tm utilizando Taq ou pfu polimerases. Para ter resultados ideais, o Tm deve ser calculado com base nas informações encontradas no site dos fornecedores da enzima. Além disso, devido à maior velocidade da Phusion, 15 a 30 segundos são normalmente suficientes para a amplificação de cada kb da sequência de interesse.

Após a PCR, o produto necessita de ser carregado num gel (Figura 2D). A banda correspondente precisa de ser cortada e o ADN extraído. É essencial sequenciar o produto PCR uma vez que o produto PCR pode incluir mutações. Há vários kits de clonagem PCR disponíveis, alguns dos quais são mostrados na Tabela 2. Utilizamos o pJET1.2/blunt cloning vector (Thermo Scientific, publicação de patente: US 2009/0042249 A1, número de adesão Genbank EF694056.1) e clonámos o produto PCR no vector linearizado. Este vetor contém um gene letal (eco47IR) que é ativado caso o vetor se torne circularizado. No entanto, se o produto PCR for clonado no local de clonagem dentro do gene letal, este último é perturbado permitindo que as bactérias cresçam colónias após a transformação. Os vetores circularizados que não contêm o produto PCR expressam o gene tóxico, o qual, portanto, mata as bactérias impedindo a formação de colônias. Os clones bacterianos devem então ser cultivados, o ADN plasmídeo isolado e sequenciado consecutivamente. A qualidade do plasmídeo isolado é essencial para resultados óptimos de sequenciação. Isolamos o DNA plasmídeo a partir de um total de 1,5 ml de bactérias cultivadas (produzem 6 μg DNA; OD 260/280 = 1,86; OD 260/230 = 2,17) usando um kit de preparação do plasmídeo (QIAGEN). Todo o processo de PCR, incluindo a clonagem do produto PCR no vector de sequenciação e a transfecção de bactérias com o vector de sequenciação, pode ser feito num dia. No dia seguinte, os clones bacterianos serão cultivados durante a noite antes de serem enviados para sequenciamento.

Quadro 2 Vetores comuns na clonagem de genes

Análise de dados de sequenciamento

As empresas de sequenciamento normalmente relatam os dados de sequenciamento como um arquivo FASTA e também como sequências de nucleotídeos prontos via e-mail. Para análise de sequências, os seguintes websites podem ser usados:

http://blast.ncbi.nlm.nih.gov/Blast.cgi

http://xylian.igh.cnrs.fr/bin/align-guess.cgi

Aqui vamos focar no primeiro website. Neste website, clique na opção “nucleotide blast” (Figura 4A). Uma nova janela se abre. Por padrão, a opção “blastn” (seqüências de núcleos) é marcada (Figura 4B). Então marque a caixa atrás de “Alinhar duas ou mais seqüências”. Agora duas caixas vão aparecer. Na caixa “Enter Query Sequence” (a caixa superior), insira a seqüência desejada do seu gene de interesse, que é ladeada pelos locais de restrição que você já projetou para seus primers de PCR. Na caixa “Enter Subject Sequence” (a caixa inferior), insira a seqüência ou carregue o arquivo FASTA que você recebeu da empresa de seqüenciamento. Em seguida, clique no botão “BLAST” na parte inferior da página. Após alguns segundos, os resultados serão mostrados em outra página. Uma parte dos dados de alinhamento é mostrada na Figura 4C. Para a interpretação, os seguintes pontos devem ser considerados: 1) o número de nucleotídeos idênticos (mostrado no item “Identidades”) deve ser igual ao número de nucleotídeos do seu gene de interesse. No nosso exemplo, o número de nucleotídeos do gene tdTomato, juntamente com os dos locais da enzima de restrição e da sequência Kozak, era de 735. Isto é igual ao número reportado (Figura 4C). 2) A identidade da sequência (sob o item “Identidades”) deve ser 100%. Ocasionalmente, a identidade da seqüência é 100%, mas o número de nucleotídeos idênticos é menor do que o esperado. Isto pode acontecer se um ou mais dos nucleotídeos iniciais estiverem ausentes. Lembre-se que todas as tecnologias de sequenciação têm uma taxa de erro. Para a sequenciação Sanger, esta taxa de erro é reportada como variando entre 0,001% e 1%. A substituição, eliminação ou inserção de nucleotídeos pode ser identificada através da análise dos resultados da sequenciação. Portanto, se a identidade da sequência não atingir 100%, o plasmídeo deve ser ressequenciado de forma a diferenciar os erros da PCR dos simples erros de sequenciação. 3) Gaps (sob o item “Gaps”) não deve estar presente. Se ocorrerem lacunas, o plasmídeo deve ser ressequenciado.

Figure 4
figure4

Análise sequencial do produto PCR utilizando a plataforma NCBI BLAST. (A) Na página web NCBI BLAST, é escolhida a opção “nucleotide blast” (marcada pela linha oval). (B) A opção “blastn” aparece por defeito (marcada pelo círculo). A sequência do gene de interesse (flanqueada pelos locais de restrição, tal como anteriormente concebidos para os iniciadores PCR) e o produto PCR devem ser inseridos nas caixas “Enter Query Sequence” e “Enter Subject Sequence”. As seqüências também podem ser carregadas como arquivos FASTA. (C) O alinhamento dos primeiros 60 nucleotídeos é mostrado. Dois itens importantes para análise de sequência são marcados por linhas ovais.

O comprimento médio de uma leitura, ou comprimento de leitura, é de pelo menos 800 a 900 nucleotídeos para sequenciamento Sanger. Para o vetor pJET um primer para frente e um para trás precisam ser usados para o seqüenciamento do gene completo. Estes primers podem normalmente cobrir um gene de até 1800 bp. Se o tamanho de um gene for maior que 1800, um primer extra deve ser projetado para cada 800 nucleotídeos extras. Como a chamada de base confiável não começa imediatamente após o primer, mas cerca de 45 a 55 nucleotídeos a jusante do primer, o próximo primer forward deve ser projetado para começar após cerca de 700 nucleotídeos a partir do início do gene. Podem ser usados diferentes websites, incluindo os seguintes, para desenhar estes iniciadores:

http://www.ncbi.nlm.nih.gov/tools/primer-blast/

http://www.yeastgenome.org/cgi-bin/web-primer

http://www.genscript.com/cgi-bin/tools/sequencing_primer_design

>

Com 735 bp de comprimento, o tamanho do produto PCR neste exemplo estava bem dentro do intervalo dos iniciadores sequenciais pJET.

Após a escolha do clone sequencial-verificado, plasmídeos vetoriais e de inserção foram digeridos pelas enzimas de restrição AgeI e SalI (Figura 5). Em seguida, foi feita a purificação do gel e a ligadura dos fragmentos. A transformação da E. coli competente com a mistura de ligadura produziu vários clones que foram triados por enzimas de restrição. Avaliamos oito clones, todos contendo a inserção do tdTomato (Figura 6). É importante colher os clones que são grandes. Os clones satélites podem não ter a construção correta. Usamos um kit de preparação rápida de plasmídeos (Zymo Research) para extrair o plasmídeo a partir de 0,6 ml de suspensão bacteriana. O rendimento e pureza foram satisfatórios para o rastreio baseado em enzimas de restrição (2.3 μg ADN; OD 260/280 = 1.82; OD 260/230 = 1.41). Para a purificação de plasmídeos em grande escala, foi utilizado um kit de preparação máxima (QIAGEN) para extrair o plasmídeo de 450 ml de cultura bacteriana (produção 787 μg ADN; OD 260/280 = 1,89; OD 260/230 = 2,22). O rendimento esperado de um plasmídeo derivado de pBR322 isolado de 1,5 ml e 500 ml de cultura bacteriana é de cerca de 2-5 μg e 500-4000 μg de DNA, respectivamente.

Figure 5
figure5

Mapas de plasmídeos vectoriais e de inserção A) Ilustração do plasmídeo CloneJET contendo o produto PCR. A inserção do produto PCR no local de clonagem do plasmídeo perturba a integridade do gene tóxico eco47IR e permite o crescimento de clones transgénicos positivos. O plasmídeo foi cortado com as enzimas AgeI e SalI gerando dois fragmentos de 3 kb e 0,7 kb de tamanho. O fragmento de 0,7 kb (gene tdTomato) foi utilizado como inserção para a clonagem. (B) Ilustração do plasmídeo vetorial. O plasmídeo foi cortado com as enzimas AgeI e SalI gerando dois fragmentos de 4,9 kb e 0,7 kb de tamanho. O fragmento de 4,9 kb foi usado como vetor para clonagem. AMP: Ampicillin resistance gene; PRE: elemento regulador pós-transcripcional; MPSV: promotor do vírus do sarcoma mieloproliferativo.

Figure 6
figure6

Screening of the final plasmid with restriction enzymes. Ilustração do plasmídeo final. Para a triagem, o plasmídeo foi cortado com a enzima BsiwI gerando dois fragmentos de 4,8 kb e 0,8 kb de tamanho. AMP: Ampicillin resistance gene; PRE: elemento regulador pós-transcripcional; MPSV: promotor do vírus do sarcoma mieloproliferativo.

alguns plasmídeos tendem a recombinar dentro do hospedeiro bacteriano criando inserções, supressões e recombinações. Nestes casos, o uso de um E. coli recA-deficiente pode ser útil (Tabela 1). Além disso, se o GOI for tóxico, a incubação de bactérias a temperaturas mais baixas (25-30°C) e utilizando estirpes ABLE C ou ABLE K pode contornar o problema.

Produção viral e transdução de células-alvo

Para investigar a expressão in vitro do gene clonado, as células HEK293T foram transfectadas com plasmídeos codificando o gene tdTomato, Gag/Pol alfaretroviral e o envelope da glicoproteína do vírus da estomatite vesicular (VSVG). Estas células, que são derivadas de rim embrionário humano, são facilmente cultivadas e prontamente transfectadas. Portanto, elas são amplamente utilizadas em biotecnologia e terapia genética para gerar partículas virais. As células HEK293T requerem divisão dia sim, dia não, utilizando um meio quente. Elas não devem atingir 100% de confluência para obter resultados ótimos. Para ter uma boa eficiência de transfecção, estas células precisam de ser cultivadas durante pelo menos uma semana para que se encontrem em fase de registo. A eficiência transfeccional foi de 22%, determinada com base na expressão do tdTomato por microscopia de fluorescência 24 horas depois (Figura 7A-B). Para gerar uma linha celular de leucemia murina expressando o gene tdTomato para estudos de imunoterapia, as células leucêmicas C1498 foram transduzidas com o vírus recém-colhido (36 horas de transfecção). Estudos de imagem (Figura 7C) e análise citométrica de fluxo (Figura 7D) quatro dias após a transdução confirmaram a expressão do tdTomato na maioria das células.

Figure 7
figure7

Avaliação da expressão in vitro do gene clonado. (A, B) As células HEK293T foram transfectadas com Gag/Pol, VSVG, e plasmídeos tdTomato. A expressão do gene tdTomato foi avaliada através de microscópio de fluorescência. As imagens fluorescentes foram sobrepostas a uma imagem de campo brilhante para a diferenciação das células positivamente transduzidas. A eficiência da transfecção foi determinada com base na expressão do tdTomato após 24 horas. Células HEK293T não transferidas foram usadas como controles (histograma azul). (C, D) A linha de células de leucemia murina C1498 foi transduzida com vírus fresco. Quatro dias depois, a expressão do transgene foi avaliada por microscopia de fluorescência (C) e citometria de fluxo (D). Células C1498 não transgênicas foram usadas como controle (histograma azul). As barras de escala representam 30 μm.