HoundDog.ai aiuta gli sviluppatori a prevenire la perdita di informazioni personali

HoundDog.ai, una startup che aiuta gli sviluppatori a garantire che il loro codice non rilasci informazioni personali identificabili (PII), è uscita dallo stealth Wednesday e ha annunciato un round di finanziamento seed da $3.1 milioni guidato da E14, Mozilla Ventures e ex/ante, oltre a diversi investitori angelo. A differenza di altri strumenti di scansione, HoundDog guarda effettivamente il codice che uno sviluppatore sta scrivendo, utilizzando sia corrispondenze di modelli tradizionali che modelli di linguaggio estesi (LLM) per trovare eventuali problemi.

HoundDog è stata fondata da Amjad Afanah, che in precedenza ha cofondato DCHQ, acquisita successivamente da Gridstore (che, per complicare le cose, ha poi cambiato nome in HyperGrid) nel 2016. Afanah ha anche cofondato apisec.ai, che è ancora in funzione, e ha lavorato presso la startup di guida autonoma Cruise. L'ispirazione per HoundDog è arrivata durante il suo periodo presso la startup di sicurezza dei dati Cyral e parlando con i team della privacy lì, mi ha detto.

Crediti immagine: HoundDog.ai

"Quando ero in Cyral, avevamo molti dati", ha detto. "Ciò che fa Cyral - come molti altri nello spazio della sicurezza dei dati - è concentrarsi sui sistemi di produzione. Ti aiutano a scoprire, classificare i tuoi dati strutturati e i tuoi database, e quindi ti aiutano a applicare i controlli di accesso. Ma il feedback travolgente che continuavo a sentire sia dai team di sicurezza che di privacy era: 'Sai, è un po' troppo reattivo e non tiene il passo con le modifiche nella base di codice.'"

Quindi HoundDog sposta questo processo ancora più a sinistra. Anche se si trova ancora nel flusso di integrazione continua e non ancora nell'ambiente di sviluppo (anche se potrebbe accadere in futuro), l'idea qui è trovare potenziali perdite di dati prima che il codice venga unito. E soprattutto, HoundDog lo fa guardando il codice effettivo, non il flusso di dati che produce. "La nostra fonte di verità è la base di codice", ha detto Afanah.

Crediti immagine: HoundDog.ai

Grazie a questo, se un team di sviluppo inizia a raccogliere numeri di previdenza sociale, ad esempio, HoundDog solleverebbe un segnale di allarme e avviserebbe il team prima che il codice venga unito; avviserebbe anche il team di sicurezza. Questo potrebbe essere potenzialmente un problema importante e costoso, dopotutto.

Il servizio supporta attualmente codice scritto in Java, C#, JavaScript e TypeScript, nonché query SQL, GraphQL e OpenAPI/Swagger. Il supporto per Python è imminente, dice l'azienda.

Afanah ha notato che uno strumento del genere sta diventando particolarmente importante in quest'era del codice generato dall'IA, qualcosa che anche il CEO di Replit (e investitore angelo di HoundDog) Amjad Masad ha sottolineato.

"Poiché un numero crescente di aziende si rivolge al codice generato dall'IA per accelerare lo sviluppo, incorporare le migliori pratiche di sicurezza e garantire la sicurezza del codice generato diventa essenziale", ha detto Masad. "HoundDog.ai sta aprendo la strada nel garantire i dati PII all'inizio del ciclo di sviluppo, rendendolo un componente indispensabile di qualsiasi flusso di lavoro di generazione di codice AI. Questo è il motivo per cui ho scelto di investire in questa azienda."

HoundDog utilizza anche l'IA, però. Attualmente si affida ai modelli di OpenAI per farlo, ma è importante sottolineare che questo è facoltativo. Gli utenti che si preoccupano che il loro codice esca dai loro repository privati possono anche scegliere di fare affidamento solo sullo scanner di codice più tradizionale dell'azienda.

Una parte importante della proposta di valore di HoundDog è che può ridurre i costi di conformità per le startup grazie alle sue capacità di generazione di report automatizzate. Il servizio può generare automaticamente un registro delle attività di trattamento (RoPA). Per fare ciò, HoundDog utilizza l'IA generativa per generare questi report e invia quei dati a OpenAI. Il team sottolinea che vanno condivise solo le chiavi che il servizio ha scoperto attraverso il suo scanner regolare e che il codice sorgente effettivo non viene condiviso.

L'azienda offre un piano gratuito limitato, con piani a pagamento a partire da $200 al mese per la scansione fino a due repo.