想象一下,星团(tuán)、星云和其他星际(jì)现(xiàn)象都是由计算(suàn)机在无人监督的情况(kuàng)下凭(píng)空生成(chéng)的。这听起(qǐ)来可能像是对未来(lái)全息技术的描述,但是爱丁堡大学感知研究所和(hé)天文(wén)学(xué)研究所的研究人(rén)员,就在人(rén)工智能(néng)的帮助下(xià)设计了这(zhè)样一个系统。
研究人员描(miáo)述了一种(zhǒng)人工智能(néng)模(mó)型,该模型能(néng)够生成合成星(xīng)系的高(gāo)分辨率图像,这些图像遵循了真实(shí)的星(xīng)系(xì)分布(bù)。
“21世纪的天文学发现自己拥有大(dà)量(liàng)数据,大(dà)部分数据在捕获时会被过滤掉,以节省内存存储,”他们写道。“对于(yú)深度学(xué)习等现(xiàn)代技术来说,进入这一领域的(de)时机(jī)已经成熟。星系在这类应(yīng)用中起了关键作用,我们探索了利用人工智能来生成星系(xì)图像的可(kě)能性。”
该团队机器(qì)学习架构的核心(xīn)是生成对抗性网络(GAN)——由(yóu)生成样本的生成器和(hé)试图区分生成(chéng)样本和真实(shí)样本(běn)的鉴(jiàn)别器组成的两部分(fèn)神经(jīng)网络。将GAN描(miáo)述为(wéi)AI算法中的(de)“神童(tóng)”并不夸张;它们被用(yòng)来发现(xiàn)新药(yào),制(zhì)作(zuò)令人(rén)信(xìn)服的汉堡和蝴蝶照片,甚(shèn)至生成(chéng)脑癌的人工(gōng)扫描图(tú)。
这(zhè)一星系生成系统由两个五层GANs组(zǔ)成:阶段一GAN和阶段二GAN。第一个生成(chéng)低分辨率图像(64x64像素),而(ér)第二个使用一(yī)种叫做(zuò)超分辨率的技(jì)术将它(tā)们转换成高(gāo)分辨率图像(128x128像素)。研究人员指出,在实际过程中,阶段二GAN会自我填充缺失的像素,更(gèng)加注重现实性而(ér)非准确性。
为(wéi)了(le)“鼓励(lì)”阶段二GAN中的生(shēng)成器生成类似于放大实像对应物的合成星系图像,该论(lùn)文作者引入了(le)一个“双目标函数”,该函(hán)数计算了(le)分辨率增强图像和实像之间的(de)误差标(biāo)准。其(qí)结果是生(shēng)成(chéng)了(le)大量(liàng)保留星(xīng)系“更稀有”特征的样本(běn),如旋臂(bì)。
研究人员使用英(yīng)伟达GTX 1060 GPU在PC上训练人工(gōng)智(zhì)能系统,并(bìng)为其提供来自Galaxy Zoo 2数据集的恒星和行星(xīng)体的全色图像(xiàng),Galaxy Zoo 2是(shì)一个众(zhòng)包天文学项目。他们在评估结(jié)果时考虑了(le)四个属性:椭圆度(dù),或偏离圆形度的程度;与水平面的(de)仰角;总(zǒng)流量;以及(jí)半(bàn)长轴(椭圆最长直径的一半)的尺寸测量。
在(zài)论文的最(zuì)后,研(yán)究人(rén)员写道(dào),该模型生(shēng)成(chéng)了非常类似真实星系“物理真实”的图像。他们认为,这一系(xì)统可以被用来扩充真实样本的数据(jù)库,实际上这也是深度学(xué)习(xí)模型的(de)数(shù)据(jù)源。
“能够创建物理真实的星系图像生成模型(xíng)有(yǒu)许多实际用途(tú),”他(tā)们写道。“我们的工作展示了GAN架构作为现代天文学宝贵(guì)工具的潜(qián)力。”