Neglected Risks: The Disturbing Reality of Children's Images in Datasets and the Urgent Call for Accountability

Carlos Caetano, Gabriel O. dos Santos, Caio Petrucci, Artur Barros, Camila Laranjeira, Leo S. F. Ribeiro, J\'ulia F. de Mendon\c{c}a, Jefersson A. dos Santos, Sandra Avila
https://arxiv.org/abs/2504.14446 https://arxiv.org/pdf/2504.14446 https://arxiv.org/html/2504.14446

arXiv:2504.14446v1 Announce Type: new
Abstract: Including children's images in datasets has raised ethical concerns, particularly regarding privacy, consent, data protection, and accountability. These datasets, often built by scraping publicly available images from the Internet, can expose children to risks such as exploitation, profiling, and tracking. Despite the growing recognition of these issues, approaches for addressing them remain limited. We explore the ethical implications of using children's images in AI datasets and propose a pipeline to detect and remove such images. As a use case, we built the pipeline on a Vision-Language Model under the Visual Question Answering task and tested it on the #PraCegoVer dataset. We also evaluate the pipeline on a subset of 100,000 images from the Open Images V7 dataset to assess its effectiveness in detecting and removing images of children. The pipeline serves as a baseline for future research, providing a starting point for more comprehensive tools and methodologies. While we leverage existing models trained on potentially problematic data, our goal is to expose and address this issue. We do not advocate for training or deploying such models, but instead call for urgent community reflection and action to protect children's rights. Ultimately, we aim to encourage the research community to exercise - more than an additional - care in creating new datasets and to inspire the development of tools to protect the fundamental rights of vulnerable groups, particularly children.

Neglected Risks: The Disturbing Reality of Children's Images in Datasets and the Urgent Call for Accountability

Including children's images in datasets has raised ethical concerns, particularly regarding privacy, consent, data protection, and accountability. These datasets, often built by scraping publicly available images from the Internet, can expose children to risks such as exploitation, profiling, and tracking. Despite the growing recognition of these issues, approaches for addressing them remain limited. We explore the ethical implications of using children's images in AI datasets and propose a pipeline to detect and remove such images. As a use case, we built the pipeline on a Vision-Language Model under the Visual Question Answering task and tested it on the #PraCegoVer dataset. We also evaluate the pipeline on a subset of 100,000 images from the Open Images V7 dataset to assess its effectiveness in detecting and removing images of children. The pipeline serves as a baseline for future research, providing a starting point for more comprehensive tools and methodologies. While we leverage existing models trained on potentially problematic data, our goal is to expose and address this issue. We do not advocate for training or deploying such models, but instead call for urgent community reflection and action to protect children's rights. Ultimately, we aim to encourage the research community to exercise - more than an additional - care in creating new datasets and to inspire the development of tools to protect the fundamental rights of vulnerable groups, particularly children.

arXiv.org
file:///private/var/mobile/Containers/Data/Application/5E031DD4-F6AC-4110-BF16-477D627C8AC4/tmp/documents/4CB33014-CB85-41D3-9D5F-813013E3B786/PHOTO-2023-09-27-12-50-03.jpg divulgando o trabalho da minha irmã. #PraCegoVer,FotoDivulgandoOTrabalhoDeLimpezaDePeleDaMinhaIrmã,ETemOTelefoneParaContato. 21965063098

https://youtu.be/BkhqQNd-ASA

Bolsonaristas com Alexandre de Moraes e Barroso: burrice, ódio e as bolhas
_________
Inscreva-se no canal, curta e comente no vídeo. Compartilhe em todas suas redes sociais e aplicativos de mensagem.

#PraCegoVer Link para vídeo no Youtube. Na imagem, Luís Barroso e Alexandre de Moraes

Bolsonaristas com Alexandre de Moraes e Barroso: burrice, ódio e as bolhas | Blog do Cadu Amaral

YouTube

Mais uma vez, "para variar", a sacanagem do Youtube.

Do nada, cinco curtidas a menos. Isso agora pela manhã, mas é provavél que tenha ocorrido entre a noite de ontem a madrugada de hoje.

#PraCegoVer Prints de tela do aplicativo Youtube Studio mostrando que a plataforma retirou cinco curtidas dos vídeos do Blog do Cadu Amaral no Youtube

https://youtu.be/BkhqQNd-ASA

Bolsonaristas com Alexandre de Moraes e Barroso: burrice, ódio e as bolhas
_________
Inscreva-se no canal, curta e comente no vídeo. Compartilhe em todas suas redes sociais e aplicativos de mensagem.

#STF

#PraCegoVer Link para vídeo no Youtube. Imagem de Luís Barroso e Alexandre de Moraes

Bolsonaristas com Alexandre de Moraes e Barroso: burrice, ódio e as bolhas | Blog do Cadu Amaral

YouTube

ASSISTA: https://youtu.be/BkhqQNd-ASA

Bolsonaristas com Alexandre de Moraes e Barroso: burrice, ódio e as bolhas
_________
Inscreva-se no canal, curta e comente no vídeo. Compartilhe em todas suas redes sociais e aplicativos de mensagem.

#Lula

#PraCegoVer Link para vídeo no Youtube. Imagem de Luís Barroso e Alexandre de Moraes

Bolsonaristas com Alexandre de Moraes e Barroso: burrice, ódio e as bolhas | Blog do Cadu Amaral

YouTube
#PraCegoVer Print de um tuíte do governador de Goiás Ronaldo Caidado afirmando, horas antes da votação na Câmara dos Deputados, que o texto da reforma tributária não seria aprovado. Na legenda do card três emojis de grito que simbolizam, nesse contexto, gargalhadas
#Pracegover Link para vídeo no Youtube sobre uma discussão entre Jair Bolsonaro e Tarcísio Freitas, governador do São Paulo, sobre a reforma tributaria. Na imagem, Bolsonaro e Tarcísio sentados e separados por um espaço em branco

https://youtu.be/83WGgoUKHrw

Lula comendo o bolsonarismo pelas beiradas, ampliando base e reduzindo pobreza
________
Inscreva-se no canal, curta e comente no vídeo. Compartilhe em todas suas redes sociais e aplicativos de mensagem.

#Lula

#PraCegoVer Link para vídeo no Youtube. Imagem do presidente Lula fazendo sinal de positivo com o plenário da Câmara dos Deputados ao fundo. Abaixo da imagem gerada, o título do vídeo Lula comendo o bolsonarismo pelas beiradas, ampliando base e reduzindo pobreza

Lula comendo o bolsonarismo pelas beiradas, ampliando base e reduzindo pobreza | Blog do Cadu Amaral

YouTube
#PraCegoVer Link para vídeo sobre a decisão de Lula em manter Nísia Trindade à frente no Ministério da Saúde. Na imagem, Lula ao lado da ministra Nísia Trindade e ambos com os braços erguidos e de mãos dadas