Cum să eliminați etichetele HTML din Foi de calcul Google
Foi Google Google Documente Google Erou / / June 08, 2023

Publicat

Dacă copiați date din pagini web în Foi de calcul Google, este posibil să includă o mulțime de cod HTML nedorit. Iată cum puteți elimina etichetele HTML din Foi de calcul Google.
Foi de calcul Google este o modalitate excelentă de a organiza și analiza datele. Cu toate acestea, ca orice program bun, gunoiul intrat este egal cu gunoiul afară. Dacă vă extrageți datele din alte surse, este posibil să obțineți mai mult decât v-ați așteptat; este posibil să importați din neatenție informațiile dorite, dar și o grămadă de etichete HTML inutile. Până nu scăpați de aceste etichete, nu veți putea face mare lucru cu datele dvs.
Din fericire, nu este prea dificil să îndepărtați toate acele etichete HTML și să lăsați doar informațiile pe care le doriți. Iată cum puteți elimina etichetele HTML din Foi de calcul Google.
Ce sunt etichetele HTML?
Etichetele HTML fac parte din codul HTML (HyperText Markup Language) care spune unui browser web cum să afișeze conținutul acelor etichete. De exemplu, o etichetă HTML poate spune browserului dvs. să afișeze o secțiune de text cu caractere aldine sau cursive sau să alinieze textul la centru sau să creeze un cadru în care conținutul poate fi încorporat.
Aceste etichete HTML au întotdeauna același format. Ele încep cu numele etichetei cuprinse între paranteze unghiulare, cum ar fi
Când copiați date dintr-o pagină web, precum și valorile pe care doriți să le copiați, este posibil să copiați și aceste etichete HTML din greșeală. Acestea nu vă sunt utile în foaia de calcul, așa că veți dori să le eliminați și să lăsați doar informațiile pe care le doriți cu adevărat.
Cum să eliminați etichetele HTML din Foi de calcul Google folosind o formulă
Puteți crea o formulă care va privi o celulă, va elimina toate etichetele HTML și va returna tot ce a mai rămas. Celula originală va rămâne neatinsă, dar noua celulă va avea toate etichetele HTML eliminate, lăsând doar datele pe care le doriți. Puteți crea această formulă pentru o celulă și apoi o puteți aplica rapid la mai multe celule.
Pentru a elimina etichetele HTML folosind o formulă în Foi de calcul Google:
- Selectați celula de lângă prima celulă care include etichete HTML.
- Introduceți următoarele:
=REGEXREPLACE(
- Selectați celula care conține codul HTML.
- Tastați o virgulă, apoi:
"]+>","")
- presa introduce iar etichetele HTML ar trebui eliminate din datele dvs.
- Pentru a aplica formula altor celule, faceți clic și mențineți apăsat mânerul de glisare din colțul de jos al celulei.
- Trageți în jos peste celulele în care doriți să copiați formula.
- Eliberați și formula va fi copiată în acele celule și va elimina etichetele HTML din datele rămase.
Această formulă funcționează folosind REGEXREPLACE funcţie. Această funcție vă permite să înlocuiți o parte dintr-un șir cu un șir diferit. Furnizați textul de înlocuit selectând celula care conține etichetele HTML.
Apoi furnizați o expresie regulată pe care funcția o va căuta. În acest caz, expresia regulată este:
]+>
Această expresie caută un șir care începe cu o paranteză unghiulară deschisă, conține cel puțin un caracter care nu este o paranteză unghiulară și se termină cu o paranteză unghiulară închisă. După cum am văzut mai devreme, deoarece toate etichetele HTML încep și se termină cu paranteze unghiulare, această expresie regulată va găsi toate exemplele acestor etichete.
Partea finală a formulei înlocuiește orice instanță de potrivire pentru expresia regulată cu nimic. Deoarece toate etichetele HTML sunt înlocuite cu nimic, tot ce rămâne este textul rămas.
Cum să eliminați etichetele HTML din Foi de calcul Google folosind Găsire și înlocuire
Un defect al acestei metode este că, deși va elimina etichetele HTML din datele dvs., creează o nouă coloană de date și vă lasă în continuare cu datele etichetate originale. Dacă ștergeți datele originale, noile valori eliminate vor dispărea și ele, deoarece formula nu are ce să lucreze.
Puteți copiați și inserați datele dvs. ca valori, dar acest lucru nu este ideal. O alternativă este să utilizați Găsiți și înlocuiți pentru a elimina etichetele HTML din celule și a lăsa rezultatul în aceeași celulă.
Pentru a elimina etichetele HTML folosind Găsiți și înlocuiți în Foi de calcul Google:
- Apasă pe Editați | × meniul.
- Selectați Găsiți și înlocuiți.
- În Găsi câmp, introduceți aceeași expresie regulată pe care am folosit-o în formula noastră:
]+>
- Asigura-te ca Căutați folosind expresii regulate este bifat, deoarece în caz contrar, Find and Replace va căuta textul exact al expresiei noastre regulate.
- Clic Înlocuiește-le pe toate.
- Etichetele HTML ar trebui să dispară, lăsând să conțină doar datele pe care le doriți.
Aflați mai multe despre Foi de calcul Google
Învățarea cum să eliminați etichetele HTML din Foi de calcul Google vă asigură că nu trebuie să pierdeți ore întregi editând manual toate datele pentru a elimina etichetele nedorite. Folosind oricare dintre metodele de mai sus, puteți scăpa rapid de etichete și puteți lăsa doar datele de care aveți nevoie. Abilitatea de a folosi expresii regulate este o adevărată salvare aici; cu siguranță merită să aflați mai multe despre RegEx, deoarece vă poate economisi o cantitate imensă de timp.
Există o mulțime de alte sfaturi și trucuri utile pentru Foi de calcul Google pe care le puteți învăța. Dacă încerci să urmărești timpul, poți învăța cum să utilizați marcajele de timp în Foi de calcul Google. Dacă formulele nu vă oferă rezultatele dorite, puteți învăța cum să afișați formule în Foi de calcul Google astfel încât să le puteți verifica pentru erori. Și dacă doriți să utilizați datele dintr-un alt document, puteți învăța cum interogați o altă foaie în Foi de calcul Google.