Pengumpulan data. Kami memulai pencarian kami dengan mengambil sampel bintang dari Gaia Katalog DR3-2MASS-AllWISE. Pencocokan silang antara katalog-katalog ini dilakukan dengan menggunakan allwise_best_neighbour, tmass_psc_xsc_best_neighbour, Dan tmass_psc_xsc_join katalog yang disediakan oleh Gaia konsorsium. Dalam sampel ini, fokus kami adalah memilih bintang yang terletak dalam jarak 300 parsec (pc) berdasarkan jarak geometris yang diperoleh dalam Early Data Release 3 (EDR3; Bailer-Jones et al. 2021). Kami memilih untuk memanfaatkan jarak EDR3 daripada Gaia Jarak DR3, karena jarak tersebut berasal dari spektrum BP/RP resolusi rendah dan oleh karena itu tidak tersedia untuk sebagian besar bintang dalam sampel.
Mengikuti kriteria yang disebutkan di atas, sampel awal kami terdiri dari sekitar 5 juta sumber. Selanjutnya, kami menerapkan kriteria seleksi tambahan, menuntut deteksi pada tanggal 12 dan 22 frekuensi   m band (W3 dan W4, masing-masing) dari WISE. Pilihan ini dimotivasi oleh fakta bahwa kelebihan inframerah yang diharapkan dari DSs terutama terlihat pada pita-pita ini, mengingat kisaran suhu yang diharapkan untuk DSs, sebagaimana diuraikan dalam Bagian 2.2. Kami juga mengecualikan sumber yang menunjukkan kontaminasi menurut WISE bendera kontaminasi. Sebagai hasil dari langkah penyaringan ini, sampel kami dikurangi menjadi sekitar 320000 bintang.
Teori dan model. Langkah selanjutnya dalam jalur kami adalah menentukan seberapa mirip fotometri bintang-bintang dalam katalog dengan bintang-bintang deret utama hipotesis yang menampung DS. Penilaian ini memerlukan pemahaman tentang bagaimana fotometri bintang berubah ketika dikelilingi oleh DS, yang melibatkan dua efek: pengaburan bintang oleh DS dan emisi ulang radiasi yang diserap oleh struktur pada panjang gelombang yang lebih panjang. Untuk memprediksi karakteristik pengamatan sistem komposit yang terdiri dari bintang dan DS (DS), kami menggunakan model yang disajikan dalam Suazo et al. (2022). Model ini menggabungkan fluks fotometrik yang diharapkan dari DS ke dalam fotometri bintang deret utama yang diamati untuk mensimulasikan sistem gabungan. Secara sederhana, fotometri bintang dimodifikasi menurut persamaan berikut:
Pencarian jaringan. Setelah menghasilkan model 220745, kami melanjutkan untuk membandingkan fotometri semua bintang deret utama yang tersisa dari Bagian 2.1 untuk model-model ini. Hal ini melibatkan melakukan pencarian grid untuk menemukan model yang paling sesuai untuk masing-masing 320000 sumber. Pemilihan model yang paling cocok untuk setiap bintang didasarkan pada minimalisasi root mean squared error (RMSE) antara data observasi dan prediksi model.
Setelah memfilter bintang berdasarkan kriteria RMSE, kami melanjutkan mengklasifikasikan sumber yang tersisa menggunakan jaringan saraf. Klasifikasi ini bertujuan untuk membedakan apakah sumber terletak di wilayah nebular. Nebula dapat menghasilkan fitur yang mirip dengan yang secara hipotesis dihasilkan oleh DS, itulah motivasi di balik pengembangan algoritma ini.
Klasifikasi gambar. Setelah memilih kandidat menggunakan RMSE sebagai metrik kesesuaian kami, kami menemukan bahwa bintang-bintang muda yang tertutup debu atau bintang-bintang yang terkait dengan nebula menonjol muncul sebagai hasil positif palsu yang umum. Pencarian sebelumnya untuk sumber inframerah (misalnya Kennedy dkk. 2012; Ribas dkk. 2012) mengalami masalah kontaminasi karena keberadaan sumber di latar depan atau di dekatnya, yang dapat menyebabkan pergeseran pusat foto secara besar-besaran WISE pita dan/atau morfologi yang diperluas. Semua fenomena ini dapat menghasilkan tanda fotometrik yang mirip dengan model kami. Untuk mengurangi jumlah penyelundup dalam bentuk bintang-bintang muda yang tidak jelas dalam sampel kami, kami mengembangkan algoritma untuk mengklasifikasikan apakah bintang-bintang terletak atau tidak di wilayah nebular berdasarkan pada lokasinya. WISE gambar-gambar. Algoritma ini menggunakan normalisasi W3 gambar sebagai masukan dan bertujuan untuk mengklasifikasikan bintang berdasarkan letaknya di wilayah nebular. Arsitektur CNN yang digunakan dalam pekerjaan ini disajikan pada Tabel 1, dan dikembangkan menggunakan library PYTHORCH (Paszke dkk. 2019).
Emisi H. Emisi foton H merupakan tanda penting dari bintang-bintang muda, terutama selama episode pertambahan kuat. Ketika protobintang muda memanas, ia mengionisasi cakram akresi yang didominasi hidrogen di sekitarnya, yang akhirnya memancarkan foton H (Barrado y Navascus & Martn 2003).
Di dalam Gaia DR3, lebar pseudo-ekuivalen (EW) dari H disediakan sebagai salah satu produk baru (Creevey et al. 2023; Fouesneau dkk. 2023), dan ini menjadi salah satu parameter terpenting saat menyingkirkan penyusup. Sama seperti variabilitas optik yang merupakan ciri khas bintang pra-deret utama, emisi foton H akibat eksitasi hidrogen selama proses tambah tumbuhnya juga merupakan ciri penting lainnya. Untuk menyaring positif palsu, sumber dengan H EWs lebih rendah dari nol (pada 3) ditolak, yaitu sumber dengan emisi H terdeteksi pada tingkat kepercayaan 99,7 persen.
Variabilitas optik. Bintang-bintang pra-deret utama, yang berada pada tahap awal evolusi bintang, secara alami dapat memancarkan radiasi infra merah karena adanya piringan akresi yang mengelilingi bintang pembentuknya. Bintang-bintang muda ini sering menunjukkan variabilitas kecerahan sebagai ciri khasnya (misalnya Joy 1945; Herbst dkk. 2007). Variabilitas ini dapat disebabkan oleh berbagai faktor, termasuk peristiwa pengaburan di sekitar bintang, titik panas pada bintang atau piringan, semburan akresi, dan perubahan struktural yang cepat pada piringan akresi (Cody et al. 2014).
Penting untuk dicatat bahwa pemeriksaan ini menolak potensi kawanan Dyson dengan elemen penyerap yang sangat besar karena pada prinsipnya hal ini dapat menghasilkan variasi fotometri bintang induk yang dapat dideteksi. Namun, variasi ini dapat disalah artikan sebagai fenomena astrofisika lain seperti variasi astero seismik atau kebisingan fotometrik (Wright et al. 2016). Hal ini juga praktis untuk mengecualikan sumber variabel; jika tidak, bintang-bintang muda akan lebih mudah lolos dari jalur pipa kita.