Yapılandırılmamış Metinden Konumları Eşleme

Veriler, yapılandırılmış bir mekansal veri dosyasında yer alıyorsa bir haritaya yerleştirilebilir. Hatta elektronik tablo gibi mekansal olmayan yapılandırılmış bir veri dosyasındaki özellikleri, x,y koordinatları veya adres bilgileri gibi konum açıklamalarını kullanarak eşleyebilirsiniz. Ancak, e-posta veya başka bir metin formu gibi yapılandırılmamış mekansal olmayan verileriniz varsa ne olur?

Siz de metin tabanlı bir not veya e-postadaki koordinatlar gibi yapılandırılmamış konum açıklama metnini ayıklayabilir ve buradan mekansal veri dosyaları oluşturabilirsiniz.

Yapılandırılmamış metin, haritaya yerleştirilebilecek konum referansları içerebilir.

Yapılandırılmamış metin kaynakları nelerdir?

Veri kaynakları genellikle yapılandırılır, ancak yarı yapılandırılmış veya yapılandırılmamış da olabilirler.

Yapılandırılmış veriler, veri tabanları, elektronik tablolar veya CSV dosyaları gibi verileri düzenlemek için tasarlanmış biçimlerde depolanan metin veya diğer verileri ifade eder. Yapılandırılmış veriler son derece organizedir ve genellikle nicel olarak kategorize edilir.

Diğer veri kaynakları ise yarı yapılandırılmış veya yapılandırılmamıştır. Örneğin, yarı yapılandırılmış metni veri tabanı veya elektronik tablodan daha az yapılandırılmış bir raporda bulabilirsiniz. Fakat yapılandırılmamış verilerin önceden tanımlanmış bir veri modeli veya tanınabilir bir yapısı yoktur. Yapılandırılmamış veriler düzenlenmemiş ve daha nitelikseldir. Metin veya multimedya içeriğinden oluşur.

Yapılandırılmamış metin, verileri düzenlemek ve ayıklamak için tasarlanmamış bilgi kaynaklarından gelebilir. Aşağıda yapılandırılmamış metin kaynaklarına bazı örnekler verilmiştir:

  • Word belgeleri, metin dosyaları veya PDF dosyaları, ArcGIS LocateXT bileşeni tarafından ayıklanabilen konum bilgilerini içerebilen yapılandırılmamış metin kaynaklarına örnektir.
  • PowerPoint veya diğer sunu dosyaları bir analistin ayıklayabileceği ve eşleyebileceği konum bilgilerini içerir.
  • Raporlar, konum bilgilerinin ortak bir kaynağıdır ve yapılandırılmamış veya yarı yapılandırılmış olabilir.
  • E-postalar, yarı yapılandırılmış veya yapılandırılmamış metinlerin yaygın bir biçimidir. E-postaların bazı dahili yapıları vardır, ancak geleneksel analiz yazılımları tarafından alınamaz.
  • Web siteleri veya bloglar için XML ve HTML dosyaları, konuma göre özellik listeleri veya trafik kazaları gibi olay konumlarının dinamik güncelleştirmeleri gibi yapılandırılmamış konum bilgileri içerebilir.
  • Fotoğraflar veya diğer görüntüler konum açıklaması içerebilir. Fotoğraflar, koordinat bilgileri de dahil olmak üzere bir dizi ayarda meta verileri saklamış olabilir.
  • Facebook, Twitter ve LinkedIn gibi sosyal medya platformlarından üretilen veriler yapılandırılmamıştır. Sohbetlerden, forumlardan ve anlık iletilerden gelen iletişimler de yararlı konum bilgileri için taranabilir.

Yukarıda bahsedilen örneklerdeki gibi yapılandırılmamış veri kaynaklarından gelen bilgileri ArcGIS LocateXT bileşeni ile yeni bir mekansal veri katmanına getirebilir, haritalayabilir ve raporlar için birer birer öznitelik bilgileri ekleyebilirsiniz.

Yapılandırılmamış veri kaynaklarından bir haritaya konum eklemek

Yerel klasörlerinizde çeşitli biçimlerde kaydedilmiş bir dizi yapılandırılmamış belgeniz olabilir. Bu belgeler içerisinden de mekansal verileri çıkarmanız gerekebilir. Örneğin bir eğlence parkurunun büyük bir bölümünde bakım yapmak istiyorsunuz. Bisikletçilerden, yürüyüşçülerden ve koşuculardan parkur sorunlarına dair düzenli olarak tarih, konum, bakım sorunu ve sorunun kısa açıklamasını içeren e-posta alıyorsunuz ve bu şekilde parkur bakım raporları topluyorsunuz.

Bu raporları mekansal veri katmanı haline getirmek için ArcGIS Pro içerisinde ArcGIS LocateXT bileşenini kullanabilirsiniz. Bunun için ArcGIS Pro’yu başlatarak bir şablon oluşturmanız gerekir.

Özel bir şablon dosyası oluşturun

Map sekmesinin Layer grubunda Add Data Extract Locations’a tıklayın ve şablon oluşturmaya başlayın. Şablonlar, yapılandırılmamış metin belgelerinden konumları ve diğer bilgileri çıkarmak için kullanılan ayar ve özellikler koleksiyonlarıdır.

Açılan Extract Location panelinden yeni detay sınıfınızın kaynağını belirterek yapılandırılmamış metinden çıkarmak istediğiniz özel nitelikleri ayarlayın.

Yol sorunları için özel öznitelik oluşturun

LocateXT’nin taranan belgelerdeki anahtar kelimeleri tanımasına ve ilgili bilgileri çıkarmasına izin verecek özel bir öznitelik dosyası oluşturun. Tanınacak ve ayıklanacak sözcükleri tanımlayın ve ardından bu sözcükleri çıktı detay sınıfının öznitelik tablosunda saklayın.

Yapılandırılmamış metinden konumları çıkarın

Extract Locations bölmesinin altında Extract’i tıkladığınızda katmanınız Contents bölmesinin en üstünde görünecek ve dosyada bulunan konumlar haritaya yerleştirilecektir.

Extract Locations aracı, taranan her bir rapor hakkında faydalı öznitelik bilgileri sağlar.  Extracted Text alanı, çıktıyı tetikleyen girdi koordinatlarını içerir. Stand. Coord. alanı, verileri çıkardığınız belgenin DD, UTM ve MGRS koordinatlarında koordinat türleri olmasına rağmen, varsayılan olarak DD’ye dönüştürülmüş koordinatları içerir. Extract Locations aracı özelliklerinde koordinat türünü diğer biçimlerle değiştirebilirsiniz.

Diğer kaynaklardan konumlar ekleyin

Bakım raporlarının metin dosyasına ek olarak çeşitli koordinat biçimlerine sahip bir PDF, bir PowerPoint sunumu ve birden çok Word belgesini içeren bir klasörünüz olabilir. Bu ek raporları yeni oluşturduğunuz bakım katmanınıza dahil edebilirsiniz.

Böylece e-postalar klasörünün, Rapor PDF’inin ve PowerPoint belgesinin içeriğinin tümü taranacak ve çıktılar mevcut bakım özelliği sınıfınıza eklenecektir. Bu eylem, yapılandırılmamış bilgileri aynı koordinat tipine sahip tek bir dosyada birleştirmeniz ve yeniden biçimlendirmeniz gerekmediği için size zaman kazandıracaktır.

 

Önceki Yazı
Bölüm 2: Coğrafi ve İzdüşümlenmiş Koordinat Sistemleri
Yazıyı görüntüle
Sonraki Yazı
İstatistikçi Olmayanlar için Zaman Serileri Tahmini
Yazıyı görüntüle