N-Day-Bench – Können LLMs echte Sicherheitslücken in echten Codebasen finden?

N-Day-Bench – Können LLMs echte Sicherheitslücken in echten Codebasen finden?